Passez suffisamment de temps avec ChatGPT ou un autre robot conversationnel et il débitera rapidement des mensonges prononcés comme « vérités vraies ».

Décrites comme des « hallucinations » ou des « fabulations », ces inventions représentent maintenant un problème pour chaque entreprise, organisation ou étudiant qui tentent d’utiliser un système d’intelligence artificielle (IA) générative pour rédiger des documents et accomplir des tâches. Or, certains l’utilisent pour des tâches pouvant avoir des conséquences importantes, de la psychothérapie à la recherche, en passant par la rédaction de plaidoiries juridiques.

« Je ne pense pas qu’il existe aujourd’hui un modèle qui ne souffre pas d’hallucinations », a admis Daniela Amodei, cofondatrice et présidente d’Anthropic, qui a créé le robot « Claude 2 ».

La société Anthropic, le fabricant de ChatGPT, OpenAI, et d’autres grands développeurs de systèmes d’IA assurent qu’ils travaillent tous pour rendre leurs robots plus « fiables ». Reste à voir, maintenant, combien de temps cela prendra — et s’ils seront jamais assez bons pour, par exemple, prodiguer des conseils médicaux en toute sécurité.

« Ce n’est pas réparable, estime de son côté Emily Bender, professeure de linguistique et directrice du Laboratoire de linguistique informatique de l’Université de Washington. C’est inhérent à l’inadéquation entre la technologie et les utilisations proposées. »

Une grande partie du problème repose en fait sur la fiabilité de la technologie « générative » de l’IA. Le McKinsey Global Institute prévoit que cette industrie ajoutera à l’économie mondiale l’équivalent de 2600 à 4400 milliards $US. Et les robots conversationnels ne sont qu’une partie de cette frénésie, qui comprend aussi des technologies capables de créer des images, des vidéos, de la musique ou encore du code informatique. Presque tous ces outils incluent une composante linguistique.

Des améliorations qui ne suffiront pas

Google a déjà présenté un produit d’IA pour la rédaction de nouvelles aux agences de presse — pour lesquelles l’exactitude est primordiale. L’Associated Press (AP) explore également l’utilisation de la technologie dans le cadre d’un partenariat avec OpenAI, qui paie pour utiliser une partie des archives de textes d’AP afin d’améliorer l’intelligence de ses systèmes.

En partenariat avec les instituts de gestion hôtelière indiens, l’informaticien Ganesh Bagler travaille depuis des années afin que des systèmes d’IA puissent inventer des recettes pour les cuisines sud-asiatiques. Mais un seul ingrédient « halluciné » par le robot pourrait faire la différence entre un savoureux repas et un plat immangeable.

« Je pense que nous allons résoudre le problème des hallucinations […] dans un an et demi, deux ans », prédisait récemment Sam Altman, p.-d.g. d’OpenAI, ajoutant toutefois : « Il y a un équilibre entre créativité et précision parfaite, et le modèle devra apprendre lequel vous privilégiez ».

Mais pour certains experts qui ont étudié la technologie, comme la linguiste Emily Bender, de l’Université de Washington, ces améliorations ne suffiront pas.

« Même s’ils peuvent être réglés pour avoir raison la plupart du temps, ils auront toujours des modes de défaillance — et les échecs se produiront probablement dans les cas où il est plus difficile pour une personne lisant le texte de les remarquer, car ces échecs seront moins flagrants. »

Même le p.-d.g. d’OpenAI, qui commercialise des produits ChatGPT pour une variété d’utilisations, ne compte pas là-dessus lorsqu’il recherche des informations pour lui-même. « Je suis probablement la personne sur Terre qui fait le moins confiance aux réponses qui sortent de ChatGPT », admettait récemment Sam Altman.