Des cryptologues déchiffrent un terme censuré dans un mémo adressé par la CIA à George Bush

Un passage recouvert à l'encre noire dans un document récemment diffusé par la Maison-Blanche a été reconstitué. La méthode pourrait être appliquée à bon nombre d'archives déclassifiées.

Il «s'ennuyait» devant la télévision, le week-end de Pâques, «lorsque le mémo de la CIA à George Bush a été diffusé», se souvient David Naccache, spécialiste du chiffrement des données de la société française Gemplus. «J'ai aussitôt téléphoné à Claire Whelan, une étudiante de la Dublin City University, dont je dirige la thèse, pour lui proposer de s'attaquer aux passages caviardés», raconte-t-il. Mission accomplie, ou presque.

Le mémo en question, adressé le 6 août 2001 par la CIA au président Bush et intitulé «Ben Laden déterminé à frapper aux États-Unis», venait d'être déclassifié par la Maison-Blanche. Celle-ci voulait prouver que la précision des avertissements des services de renseignement n'était pas suffisante pour permettre au président d'empêcher les attaques du 11 septembre 2001. Mais cinq passages précisant les sources des renseignements collectés avaient été recouverts d'encre noire.

Pour le cryptologue David Naccache, ces fragments illisibles étaient autant de chiffons rouges. Le résultat de ses efforts — «conduits à titre privé», précise-t-il, soucieux de ne pas impliquer son employeur dans son initiative — a été présenté le mardi 4 mai lors de la conférence Eurocrypt 2004, qui a réuni jusqu'au 6 mai à Interlaken, en Suisse, le gratin de la cryptographie mondiale. «La démonstration était fort impressionnante», juge Jean-Jacques Quisquater (Université de Louvain-la-Neuve), spécialiste du domaine, qui salue cette entreprise de «"reverse engineering" d'un document censuré».

David Naccache et son élève ont en effet réussi à découvrir l'un des mots censurés. Le terme Egyptian leur semble le seul possible. Ils veulent peaufiner leur méthode avant de rendre leur verdict sur un passage plus long afin de ne pas la discréditer. Et ils ont carrément jeté l'éponge pour un mot totalement isolé, faute d'indices suffisants.

La technologie employée n'a, à première vue, rien de révolutionnaire. Les deux chercheurs ont d'abord «redressé» le texte, déformé lors de sa numérisation — l'inclinaison n'était que de 0,52°. Ils ont ensuite utilisé un logiciel de reconnaissance de caractères pour déterminer la police du texte qui fixe le nombre de signes par unité de longueur. Le simple recours à un dictionnaire d'anglais permet alors d'établir une liste de mots possibles. «1530 correspondaient», indique David Naccache.

Mais l'article an précédant le mot «mystère» impliquait que celui-ci commençait nécessairement par une voyelle, ce qui a permis de ramener la liste à 346 mots. En français, un indice fourni par des articles comme un ou une aurait, de la même façon, permis de resserrer les recherches. La sélection a aussi été facilitée par le fait que la police de caractère, l'Arial, est «proportionnelle», c'est-à-dire que la «chasse» des lettres varie. L'espace occupé par un i indiffère de celui pris par un w, ce qui peut donner des indices supplémentaires, par rapport aux polices dites monospace, comme le Courrier, souvent utilisé, où toutes les lettres se valent.

«Parmi les mots "survivants", cinq ou six pouvaient faire sens, mais seul "Egyptian" correspondait au contexte», indique le cryptologue. Cette dernière étape relève plus de l'intelligence humaine que de la géométrie du texte. Pour choisir parmi Ukrainian, uninvited, unofficial, incursive, Egyptian, indebted et Ugandan, les deux chercheurs se sont appuyés sur leur bon sens, l'Ouganda et l'Ukraine semblant trop éloignés du théâtre des opérations pour être retenus, par exemple.

Sans doute l'analyse du mémo de la CIA ne dévoile-t-elle qu'un «secret de Polichinelle», reconnaît David Naccache. Mais la méthode systématise les recherches. Dans un autre mémo, elle a révélé que des hélicoptères civils militarisés par les Irakiens avaient été achetés à la Corée du Sud. Et rien ne s'oppose à l'application automatisée de cette technique à l'ensemble des documents déclassifiés, dans lesquels elle pourrait mettre au jour «des mots isolés, voire des groupes de deux ou trois mots». Avis aux censeurs...