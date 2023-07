Codes secrets, langues mortes, jargons de faction ou sabirs de caste : cette série s’intéresse au décodage des langages obscurs d’hier à aujourd’hui. Aujourd’hui : comment l’intelligence artificielle aide à lire et à traduire les papyrus de l’Antiquité.

En demandant au service automatique Google Traduction de rendre en français les premiers versets de la Genèse en hébreu, on obtient : « Au commencement Dieu créa les cieux et la terre. Et la terre était dans la confusion et la confusion (sic), et les ténèbres, sur la face de l’abîme ; Et l’esprit de Dieu, planant au-dessus de la face de l’eau. »

Pas mal. En tout cas, le rendu se rapproche de la traduction humaine de Zadoc Kahn, approuvée par le rabbinat, qui va comme suit : « Au commencement, Dieu créa le ciel et la terre. Or la terre n’était que solitude et chaos ; des ténèbres couvraient la face de l’abîme, et le souffle de Dieu planait à la surface des eaux. »

Google Traduction ouvre déjà des ponts de cette qualité et même plus entre 150 langues, dont le latin et le grec. Des programmes numériques en développement cherchent à rendre aussi facile le truchement de très vieux textes écrits en langues mortes dans la pierre, sur papyrus ou sur parchemin. Il existe des dizaines de langues disparues depuis des milliers d’années, dont le sumérien, l’élamite, le louvite, l’ougaritique ou l’ombrien.

Une équipe de l’Université de Tel-Aviv a révélé en mai dans PNAS Nexus, revue spécialisée de l’Université Oxford, avoir élaboré un programme capable de traduire automatiquement l’akkadien, langue largement utilisée en Mésopotamie il y a 5000 ans.

« J’ai vu l’évolution de Google Translate, commente au Devoir Isabelle Marthot-Santaniello, du Département des sciences de l’antiquité de l’Université de Bâle, en Suisse. Il y a dix ans, quand j’enseignais à des collégiens, les élèves pouvaient insulter untel qui s’exprimait mal en disant qu’il faisait du Google Translate. Actuellement, on ne dirait plus ça. J’utilise DeepL et la qualité des traductions est impressionnante. Beaucoup de choses sont donc déjà possibles et beaucoup de choses vont avancer dans le domaine de la traduction assistée par l’intelligence artificielle, y compris dans mon domaine des langues anciennes. »

Le code papyrus

La professeure Marthot-Santaniello a commencé très jeune à se passionner pour les langues et les civilisations de l’Antiquité, comme c’est souvent le cas dans son domaine très, très pointu. Elle parle des mythologies découvertes dans les livres pour enfants, d’un voyage en Égypte à 10 ans avec ses parents qui a décidé de sa vocation. « Quand je suis revenue, j’ai annoncé que je voulais être égyptologue », raconte-t-elle.

Chose dite, chose faite. Elle a commencé l’apprentissage du latin et du grec à 13 ans, au collège en France. La maîtrise des hiéroglyphes, de l’hiératique, du démotique et du copte a suivi. « La langue égyptienne a trois mille ans d’existence, alors forcément il y a eu des étapes et des transformations », explique la polyglotte.

L’égyptologue a fini par bifurquer un peu par rapport à ses rêves précoces, puisque sa spécialité choisie au doctorat à Paris concerne maintenant la période post-pharaonique, celle de l’Égypte gréco-romaine. « J’étudie des manuscrits rédigés en grec, très difficiles à lire. C’est une période très intéressante, qui couvre un millénaire entre Alexandre le Grand et la conquête arabe. »

Elle est arrivée à la Universität Basel, la plus vieille de Suisse, fondée en 1460, pour intégrer un projet d’édition d’une collection de papyrus grecs. En ce moment, elle travaille au chantier Der Papyri-Code, qui implique la computer vision, technique d’intelligence artificielle appuyée sur l’apprentissage profond permettant d’analyser des images, de les comprendre et de traiter les informations qu’elles contiennent. Cette vision artificielle permet, par exemple, le développement de la voiture autonome et la reconnaissance faciale.

Les programmes réussissent facilement à lire des écritures modernes à l’encre sur une page blanche. Les papyrus posent un tout autre défi. Ils sont très détériorés et l’encre contraste peu sur le support de fibre. « Il faut imaginer une encre marron sur un support marron abîmé », résume la professeure. Dans le cas récent, la vision artificielle réussit la lecture presque parfaitement. Dans l’autre, la fiabilité chute de moitié, pour l’instant.

« Mon projet a commencé en 2018 et j’ai vraiment senti la révolution par l’intelligence artificielle, explique la papyrologue. Mes collègues informaticiens ne parlaient plus que de réseaux de neurones ou d’apprentissage profond. C’est un outil qu’il faut bien utiliser et qui peut faire des choses extrêmement intéressantes. Mais ça reste un outil. On a encore clairement besoin de nous, au début pour préparer les données et orienter la recherche ; au milieu pour vérifier les paramètres ; et à la fin pour interpréter les résultats. Je ne suis pas du tout inquiète pour mon travail, qui est appelé à se modifier toutefois. »

Un puzzle mondial

Environ 80 000 papyrus grecs sont déjà publiés. Il en reste probablement plus d’un demi-million à traiter dans les collections. Le trafic de ces trésors culturels, souvent à partir du marché des antiquités du Caire, les a éparpillés par fragments partout dans le monde. Le bout d’un texte peut être à Boston et un autre bout du même texte, à Berlin.

La professeure Marthot-Santaniello souhaite développer des outils pour suivre et analyser la forme des lettres. La recherche sur les documents numérisés se ferait alors à partir de l’image et non pas de la transcription des textes.

« Avec des fragments par-ci et par-là, on ne peut tirer grand-chose. Mais si on arrive à les rassembler bout à bout, tout d’un coup, ces fragments prennent beaucoup plus de sens. Cette technique permettrait de découvrir des fragments de littérature inconnue, une tragédie grecque perdue ou un écrit d’Aristote, par exemple, dont on n’avait plus de copie. »

Le matériel étudié couvre mille ans pendant lesquels l’écriture a évolué. L’objectif de la recherche de Bâle est de retrouver les écritures les plus similaires, avec les mêmes alpha, les mêmes bêta, etc. Les mêmes formes de lettres, quoi. Ces indices permettent d’identifier la provenance approximative, peut-être un jour la provenance et même l’auteur d’un papyrus donné.

« On n’aura pas forcément son nom, dit la professeure. On risque de l’appeler Anonyme 003 ou 004, mais ce sera déjà intéressant de savoir si un même scribe a recopié l’IIiade etla Bible dans la fin de la période gréco-romaine. Il y a plein de questions qu’on se pose encore. »

La numérisation massive va aussi faciliter et amplifier la recherche dans les textes pour finalement leur poser de nouvelles questions. Mme Marthot-Santaniello vient de faire une expérience avec des collègues qui a permis de traiter facilement cinq millions d’occurrences pour créer un panorama démontrant les transformations de la langue sur des siècles.

Elle a aussi travaillé sur les abréviations dans les papyrus. Au début du corpus, à l’époque ptolémaïque (celle de Cléopâtre, de 323 à 30 avant notre ère), les scribes utilisaient des symboles qui ont été plutôt remplacés par des abréviations (très fréquentes dans la langue latine) à la période romaine puis byzantine. « On pressentait ce phénomène, qu’on peut maintenant quantifier et suivre dans le temps. »

Les mouvements ne cessent d’épater dans ce domaine en ébullition.  En mars, l’Université du Kentucky dévoilait le Vesuvius Challenge, concours mondial pour lire et déchiffrer deux rouleaux carbonisés d’Herculanum, ville détruite en 79 en même temps que Pompéi.

Les documents découverts en 1750 ne peuvent être déroulés. L’intelligence artificielle et des images au numériseur pourraient livrer leurs mystères. Les nouveaux outils permettraient ensuite de s’attaquer au déchiffrement de la bibliothèque complète découverte à Herculanum. Avis aux intéressés : le gagnant du concours recevra 700 000 $US…

Décoloniser l’égyptologie La décolonisation s’est invitée au dernier Congrès international de papyrologie à Paris il y a un an, en juillet 2022, avec des discussions autour de la provenance des documents et de leur trafic illégal, notamment dans le domaine copte. Les pilleurs de tombes opèrent encore et des trafiquants attaquent des sites archéologiques, y volant des antiquités pour les écouler au marché noir. « On a dû se positionner clairement, dit la professeure Isabelle Marthot-Santaniello, de l’Université de Bâle. La recommandation est de ne pas étudier les papyrus ou les objets dont on n’est pas certain de la provenance, pour ne pas les mettre en valeur, leur donner plus de valeur et ainsi alimenter ce commerce qui fait des morts chaque année, il faut le dire aussi. D’un autre côté, on se dit que si on n’étudie pas ces textes, ils risquent de disparaître et des connaissances seront perdues à jamais. L’idéal, si on est contacté par un receleur, c’est d’essayer de participer au démantèlement du réseau, à notre humble niveau, pour aider à mettre fin à ce trafic qui est terrible. » La professeure d’études classiques Katherine Blouin, de l’Université de Toronto, est particulièrement active dans ce chantier postcolonial. Elle coédite notamment le site Everyday Orientalism, qui remet en question les fondements et les pratiques des disciplines spécialisées (lettres classiques, histoire ancienne, archéologie, philosophie et autres « sciences de l’Antiquité ») en relation avec les études postcoloniales.