Ces derniers mois, nous avons beaucoup entendu dire que ChatGPT était un « tueur de Google », ouvrant la voie à Microsoft pour gagner des parts de marché grâce aux avantages de l’IA générative. Cependant, cette prophétie de la mort de la recherche ne s’est pas réalisée – et ne se réalisera pas. Non seulement Google est entré dans la danse en lançant un service comparatif appelé Bard, mais il a également déclaré explicitement que Bard était un « complément à la recherche », et non un remplacement. ChatGPT et Bard prennent l’internet d’assaut, mais les entreprises (sauf celles de l’espace créatif) se grattent la tête et se demandent comment leurs employés peuvent tirer le meilleur parti de cette nouvelle technologie.
Pourquoi les entreprises sont-elles incertaines ?
Les histoires se succèdent et nous racontent comment des individus utilisent ChatGPT pour faire avancer les choses, élargir leur champ d’action et automatiser des tâches banales. Bard nous suit de près. Mais malgré tout l’enthousiasme des particuliers, de nombreuses entreprises ne savent pas exactement où elles pourraient utiliser les modèles d’IA générative. Bien qu’ils soient excellents en langage naturel, en créativité, en conversation et en résumé, ils ont des difficultés dans les contextes factuels et nuancés parce qu’ils peuvent halluciner, qu’il est difficile de valider leurs sources et qu’ils ne disposent pas des informations les plus récentes – trois domaines qui sont cruciaux pour une utilisation dans l’entreprise. Pour comprendre pourquoi il s’agit d’un problème, nous devons analyser la base de la technologie elle-même : les grands modèles de langage (LLM).
Les LLM sont formés pour générer des textes basés sur des modèles de langage, et pour cela, ils sont convaincants – ils écrivent souvent une prose parfaite et des arguments sûrs et convaincants. Cependant, l’écriture est basée sur des probabilités de mots dans le langage, et non sur une compréhension du fonctionnement du monde, de sorte que l’on ne peut pas compter sur ces modèles pour transmettre des informations précises. C’est un point essentiel pour la plupart des applications commerciales, et c’est là que la recherche entre en jeu.
Les GLLM et la recherche sont différents
La recherche concerne l’extraction. Vous demandez des informations à un moteur de recherche, qui trouvera ce qui est le plus pertinent et vous le fournira. C’est fondamentalement différent des LLM génératifs (GLLM), qui ne remontent pas à la surface du matériel préexistant mais créent plutôt une réponse sur le sujet en fonction de leurs données d’entraînement et de leurs règles de langage. Cela peut ressembler à une recherche parce qu’il présente du matériel pertinent, mais contrairement à la recherche, il ne sert pas de contenu faisant autorité (avec des liens vers les sources), mais crée plutôt une réponse qui est un reflet de ce sur quoi il a été formé. Comme il s’agit d’un reflet plutôt que d’une reproduction, la réponse peut être erronée ou dépassée, et elle n’est pas facile à valider parce qu’il n’y a pas de traçabilité vers la source.
La recherche à la rescousse
C’est ici que la recherche fait toute la différence : l’introduction des résultats d’une recherche dans un LLM génératif élimine ces lacunes. La recherche servant de source d’information pour les MLD génératifs (plutôt que les MLD eux-mêmes), la réponse est construite à partir d’informations précises, actualisées et traçables. Cette approche exploite les forces de chaque outil : les connaissances proviennent des informations les plus pertinentes trouvées par la recherche, tandis que la formulation provient du LLM génératif. Le résultat ? Des informations précises et actualisées (provenant de la recherche) exprimées en langage naturel (provenant du GLLM).
La précision de la réponse étant directement liée à la qualité des informations introduites dans le GLLM, plus les résultats de la recherche sont pertinents, plus la réponse est fiable (et complète). Une bonne pertinence est synonyme d’une grande fiabilité. À mesure que les GLLM sont adoptés par les entreprises, la recherche devient plus importante que jamais, car elle permet de relever les défis liés à l’utilisation des GLLM pour l’information et la connaissance.
Mais ce n’est pas tout
Search résout également le plus grand défi de l’utilisation des GLLM dans l’entreprise : leur manque de connaissance du contenu de l’entreprise. ChatGPT et d’autres GLLM (GPT-4, Bard, LLaMA, etc.) sont formés au contenu public – l’Internet. Ils ne savent rien de la connaissance contenue dans une entreprise, et les former à ce contenu est ridiculement long et coûteux. Mais la recherche d’entreprise sait tout sur une entreprise ; il dispose d’un accès large et sécurisé à tous les référentiels, contenus et connaissances institutionnelles de l’entreprise – et peut fournir ces connaissances à un GLLM.
L’utilisation de la recherche d’entreprise pour alimenter un GLLM permet d’obtenir les résultats les plus précis et les plus pertinents à partir de tous les contenus, quels que soient la source, le format ou la langue. Elle garantit également la sécurité en ne fournissant au GLLM que les informations auxquelles l’employé a le droit d’accéder. La combinaison de la recherche et des GLLM signifie que votre GLLM est :
- Conscient – inclure les connaissances de votre entreprise, et pas seulement le contenu public.
- Précision – Les informations proviennent directement du contenu de votre entreprise, et non du modèle, pour des résumés basés sur des faits et presque sans hallucinations.
- Transparent – avec des liens explicites vers les sources, les connaissances sont traçables.
- Actuel – Les résultats de la recherche utilisent les informations les plus récentes.
Regarder vers l’avenir
Le battage médiatique autour des GLLM comme ChatGPT et Bard est justifié. Ils vont changer notre façon de vivre et de travailler en modifiant complètement notre façon d’interagir avec l’information. Mais aussi impressionnants soient-ils, nous ne sommes qu’au début de cette révolution, et nous verrons rapidement apparaître des modèles encore plus performants qui permettront de nouvelles applications que nous ne pouvons même pas encore imaginer.
Mais il est devenu évident que les GLLM ont besoin d’une source fiable de connaissances concises, précises et pertinentes pour concrétiser cette vision, en particulier dans l’entreprise. Cette source peut être trouvée grâce à la recherche intelligente. La recherche amène les GLLM sur le lieu de travail afin que les employés puissent converser avec leur contenu en toute confiance.
Ulf Zetterberg est co-directeur général du fournisseur de solutions de recherche d’entreprise Sinequa.
Sur le même sujet :
Le défi de l’utilisation de ChatGPT pour les moteurs de recherche – Les grands modèles de langage (LLM) tels que ChatGPT sont en train de devenir des compléments pour les moteurs de recherche, mais il y a encore des écueils à prendre en compte.
Les tests de capacité du GPT-4 sont révélés, alors que la pression réglementaire de l’UE persiste – Une « équipe rouge » chargée de tester les capacités du GPT-4 a dévoilé ses conclusions, alors que les autorités de l’UE continuent d’exercer leur contrôle.