Le plagiat automatisé
Quand j’étais étudiant en informatique, on définissait l’intelligence artificielle (IA) comme la reproduction par une machine d’un acte humain dont on ne comprend pas le procédé déductif. Ainsi, on pouvait programmer un ordinateur à jouer aux échecs, mais, alors qu’un humain « voit » rapidement le coup à jouer, l’ordinateur en évalue des milliers, et les coups subséquents, pour déterminer le coup le plus prometteur, un mode opératoire assurément différent de celui des humains. En développant le concept de l’apprentissage, on s’est déplacés vers un outil de reconnaissance de formes aux résultats probabilistes. Par exemple, après qu’on lui aura soumis un million de photos de chiens, un logiciel d’IA aura élaboré un modèle visuel de ce qui représente un chien. Devant une nouvelle image, il répondra par un score de la probabilité qu’elle illustre un chien. Et si on lui soumet la photo du chapeau d’un muffin aux bleuets, le modèle pourra y voir, selon une certaine probabilité, les grands yeux d’un chihuahua. En comparaison, un enfant qui ne parle pas encore distinguera un chien d’un muffin dès sa deuxième rencontre. Mais l’ordinateur n’a pas cette intelligence. C’est ainsi que les logiciels d’assistance à la conduite d’une voiture peuvent causer un freinage d’urgence après avoir assimilé à un obstacle solide un simple sac plastique dérivant au sol.
Mais aujourd’hui, on pousse la supercherie plus loin en envahissant le domaine de la création écrite ou visuelle. Un logiciel comme ChatGPT, alimenté de millions de textes, nous en restitue une sorte de moyenne, faisant croire à une sorte de réflexion. Et comme une partie des textes sources contiendront des erreurs ou des faussetés, le résultat final en fera autant, l’algorithme n’étant doté d’aucun véritable discernement, seulement d’une pondération qu’on aura pu attribuer à certaines sources. Quel est l’intérêt pour Microsoft, et maintenant Google, d’intégrer ces IA à leur moteur de recherche ? Faire plus d’argent. En effet, si, au lieu de retourner une liste de sites Web traitant du sujet recherché, le moteur peut fournir une réponse qui semble adéquate, l’utilisateur n’ira pas voir ailleurs — au risque de se faire berner par de mauvaises réponses. Mais qu’importe, car il ne verra pas les publicités d’autrui, mais celles proposées par le moteur de recherche. Et si les documents sources sont, par exemple, des articles de journaux, n’étant pas cités ni visités, on n’aura pas à verser de droits à leurs auteurs. Copier des textes ou les remanier sans citer ses sources, en les faisant passer pour une création originale, constitue la définition du plagiat. L’IA permet de l’automatiser, et même de l’anonymiser, car on ne sait plus déterminer quels documents, parmi la myriade consultée, ont été plagiés. La seule véritable intelligence ici est celle des humains, ceux dont les travaux sont plagiés, et ceux qui profitent financièrement de ce plagiat.