Le MIT à la rescousse

C’est un joli cadeau du temps des Fêtes qui nous arrive de Boston. Un groupe de chercheurs du Media Lab, au Massachusetts Institute of Technology (MIT), vient de publier une étude sur le niveau d’influence des grandes langues internationales. Or le français se classe remarquablement bien.

Cette étude, qui compile des données issues de l’UNESCO, Twitter et Wikipédia, part de l’idée que l’influence d’une langue n’est pas seulement affaire de démographie ou de richesse, mais aussi de connectivité. Que le français soit parlé par 274 millions de personnes dans le monde, c’est déjà très bien. Mais son implantation dans les réseaux de traduction et de communication est tout aussi cruciale.

Les résultats du MIT sont d’autant plus intéressants qu’ils mesurent l’activité des locuteurs les plus influents de chaque langue : ceux qui publient et sont implantés dans les réseaux et qui communiquent dans plusieurs langues. Entre la dinde de Noël et la dinde du jour de l’An, je vous épargne les formules mathématiques en vous recommandant de consulter les tableaux interactifs.

Pour Twitter, par exemple, le Media Lab a échantillonné un milliard de micromessages entre le 6 décembre 2011 et le 13 février 2012. Ils ont identifié 550 millions de messages dans 73 langues définissables, émanant de 17 millions d’utilisateurs multilingues. C’est donc la centralité d’une langue qu’ils mesurent et par là ses interconnexions avec d’autres, c’est-à-dire la densité des canaux entre cette langue et d’autres langues.

« Twitter était un point de départ intéressant, mais on ne pouvait pas conclure grand-chose à partir de ce seul » média, dit Shahar Ronen, l’un des principaux auteurs de cette étude, actuellement analyste chez MSN à Seattle, mais que j’ai joint à Haïfa, en Israël.

L’échantillon de Twitter comportait peu de langues, seulement 73. Mais sa principale faiblesse tenait au fait que la notion de centralité est seulement supposée sur la base du multilinguisme des usagers. Il en ressort que le malais et le tagalog se classent très haut, 2e et 5e, parce que leurs locuteurs sont des utilisateurs frénétiques de cette technologie et que leur usage est multilingue — presque 100 % chez les Philippins. Et puis, l’échantillon de Twitter s’étale sur une très courte période, ce qui le rend très tributaire de l’actualité.

Les auteurs ont travaillé avec un deuxième échantillon, tiré de l’Index Translationum de l’UNESCO, qui répertorie 2,2 millions de traductions dans le monde depuis 1979. Il établit clairement la langue source et la langue cible pour chaque texte. Cela donne un réseau très défini, où le français se classe 2e, après l’anglais.

Parmi les trois listes de l’étude, celle de l’UNESCO est la seule qui montre précisément ce qui est traduit et en quelle langue. Cependant, elle est trop historique. Le nombre de traductions à partir du russe (5e au classement) a chuté dramatiquement après l’éclatement de l’empire soviétique. Quant au latin, langue morte, il s’y classe encore 9e !

La troisième liste, basée sur Wikipédia, s’intéresse également aux rédacteurs multilingues. Une fois de plus, le français ressort 3e. Contrairement à Twitter, cette liste comporte seulement quelques bizarreries. Mais son principal défaut, comme pour Twitter, est son côté implicite : le multilinguisme des rédacteurs ne montre pas ce qui a été effectivement traduit ou adapté.

Chaque liste a ses défauts. Mais, considérées ensemble, les trois forment une image nette. « L’anglais occupe une position supercentrale. Le français, l’espagnol et l’allemand sont non seulement très mondialisés, mais aussi très centraux », dit Shahar Ronen. La surprise des six auteurs concerne le chinois, l’hindi et l’arabe. « Ces langues, quoique très parlées, sont étonnamment périphériques. »

Cette étude est d’autant plus fascinante que ses conclusions font écho à d’autres classements qui montrent tous clairement que le français est loin d’être une petite langue sans intérêt. Je pense à l’étude de l’agence Bloomberg publiée en 2011, qui portait sur les langues les plus utiles aux affaires (le français ressortait troisième, après l’anglais et le mandarin). Je pense aussi au baromètre Calvet des langues du monde, d’Alain et Louis-Jean Calvet. Dans cette étude en 10 critères, le français sort aussi troisième, après l’anglais et l’espagnol. Et puis, il y a la première étude du genre, celle de l’anthropologue George Weber, dans les années 1990, qui classait les langues les plus influentes (le français ressortait deuxième).

Quelle que soit la méthodologie employée, le français continue de se classer très haut. Peu importe aussi le biais culturel des auteurs.

Cette étude du Media Lab du MIT termine donc l’année en beauté !

À voir en vidéo