La France contre Google

On connaît l'histoire de ce journaliste américain à la retraite, John Seigenthaler, qui découvrit avec stupeur que Wikipedia avait écrit de lui qu'il était soupçonné d'avoir trempé dans l'assassinat des Kennedy. L'affirmation n'était qu'une affabulation. La même aventure est arrivée au confrère d'un journal concurrent qui découvrit, lui, qu'il était censé avoir eu une liaison avec une artiste de variétés.

De telles erreurs flagrantes suffiraient à détruire la crédibilité d'une encyclopédie sérieuse comme Britannica, Universalis ou Agora. Mais s'agissant de Wikipedia, ces critiques semblent glisser comme l'eau sur le dos d'un canard. C'est que, dans certains milieux, on a pris l'habitude de tout sacrifier au dieu Modernité. Car Wikipedia est moderne, tenez-vous-le pour dit! Cela s'entend sans qu'on ait besoin de le démontrer. Il suffit de prononcer le mot «moderne» pour faire taire les critiques. Et si, en plus, la loi du nombre est avec vous, il n'y a plus grand-chose à faire. Cela est particulièrement vrai au Québec, où il n'y a pas de défaut plus grave que d'exprimer ses réserves à l'égard de certaines réalités associées à la modernité. Cela va du livre électronique à l'interculturalisme. Bref, il faut se lever de bonne heure pour critiquer la nouveauté.

Récemment, la France publiait un rapport accablant sur un autre mythe de cette prétendue modernité: Google livres. Le rapport rédigé par Marc Tessier, un ancien président de France Télévision, devrait intéresser les Québécois. Car il ne concerne rien de moins que l'avenir du livre francophone.

Google a déjà numérisé plus de 10 millions de livres afin de les rendre consultables sur Internet. Dans la majorité des cas, la société californienne est allée de l'avant sans s'encombrer des droits d'auteurs. Un jugement de cour devrait trancher la question le 18 février prochain.

En attendant, le rapport Tessier permet de saisir ce qu'il y a de pervers dans les accords que Google a signés avec plusieurs grandes bibliothèques. L'auteur juge particulièrement inacceptables les clauses d'exclusivité qui interdisent aux bibliothèques de diffuser largement, pendant une période qui peut aller jusqu'à 20 ans, les fichiers numérisés par Google à partir de leur propre fonds. Les bibliothèques, dit Marc Tessier, doivent préserver l'intégrité d'un patrimoine culturel dont personne n'a le droit de s'octroyer le monopole.

L'étude nous renseigne aussi sur certaines pratiques douteuses de Google. Un document annexe s'étend longuement sur «la médiocrité de la numérisation opérée par Google» et ses «pratiques approximatives». Contrairement à une institution comme la Bibliothèque nationale de France (BNF), dont la base de données Gallica contient un million de documents (dont 145 000 livres), Google se contente souvent d'une numérisation de basse qualité (moins de 400 ppp). Cela entraîne d'importantes erreurs dans la reconnaissance des mots lorsque vient le temps de mettre le livre sous la forme d'un fichier texte dans lequel on pourra faire des recherches.

S'il faut en croire le rapport, la qualité des ouvrages offerts par Google est finalement désastreuse comparée au soin que les éditeurs accordent généralement à leurs livres. Les tables des matières sont sens dessus dessous, les index inutilisables, les noms des collaborateurs introuvables et ceux des collections confondus avec les titres. Les experts ont relevé de nombreuses erreurs d'indexation liées au faible contrôle de la qualité. Google prévient d'ailleurs ses lecteurs que ses livres peuvent contenir «des erreurs d'orthographe, des caractères fautifs, des symboles inutiles ou des pages manquantes». Ce que Google ne dit pas, c'est que ces erreurs sont dues à sa négligence lorsque vient le temps de réviser le produit réalisé par ses ordinateurs. Un travail long, fastidieux et qui coûte cher.

Une institution qui se respecte ne peut accepter de diffuser sur Internet des textes classiques entachés de fautes aussi «innombrables», conclut l'étude. Surtout si ces copies numériques doivent un jour être les plus consultées et les plus lues. Messier demande aux bibliothèques, même si elles veulent faire affaire avec Google, de ne jamais transiger sur la qualité. Le ministre français de la Culture, Frédéric Mitterrand, s'envolera d'ailleurs pour la Californie afin de proposer à la multinationale un échange d'égal à égal de fichiers numériques sans confidentialité ni exclusivité. «S'ils disent non, dit Mitterrand, c'est que leurs grands principes philanthropiques ne sont que façade!»

Plus fondamentalement, Paris entend relancer le rôle de la BNF dans la numérisation des livres en créant une grande plateforme numérique francophone gérée par une coopérative regroupant bibliothèques et éditeurs. La France vient d'ailleurs d'annoncer qu'elle consacrera une somme considérable, plus de 1,12 milliard de dollars (750 millions d'euros), à la numérisation afin de créer une masse critique de livres en français sur Internet. Le rapport rappelle le rôle de l'Europe, mais il oublie étrangement de mentionner la Francophonie, qui n'est pourtant pas en reste sur ces questions.

Il faudrait peut-être s'en inquiéter.

À voir en vidéo