Le numérique, ce colosse à la mémoire d’argile

Photo: Illustration: Christian Tiffet
Bibliothèque et Archives nationales du Québec accélère un programme de numérisation de ses collections. Étrangement, les plus récents supports semblent maintenant les plus menacés : les disques durs ramollissent, les CD décèdent et les DVD se vident…
 
Selon des archives numérisées disponibles gratuitement en ligne, l’Allen Product Company a fait faillite en 2001. L’usine de Milford au Connecticut a été vendue aux enchères après des décennies à fabriquer des machines servant à microfilmer des archives.
 
Il traîne encore un de ces dinosaures en métal argenté dans un local de la section d’archivage du Centre de conservation de Bibliothèque et Archives nationales du Québec (BAnQ), rue Holt, à Montréal. L’appareil tout propre et parfaitement entretenu servait encore il y a quelques mois à peine. La numérisation a pris le dessus depuis et ceci a donc tué cela.
 
« Le microfilmage a commencé à être utilisé pour la protection des archives en 1937 », explique Marie-Chantal Anctil, coordonnatrice de la section de la reproduction de BAnQ. « Cette technique nous a beaucoup servis ici même si elle est un peu compliquée à utiliser parce qu’il faut travailler à l’aveuglette en faisant des tests pour arriver au bon résultat. En plus, il faut manipuler des produits chimiques avec soin. Maintenant, avec la numérisation, tout est beaucoup plus propre et efficace. »
 
Plus net, plus vite, moins cher aussi, mais pas plus simple pour autant. Étrangement, la numérisation elle-même pose d’énormes défis à la numérisation. Les plus récents supports s’avèrent finalement très instables.
 
Les disques durs ramollissent, les CD décèdent et les DVD se vident. Le numérique est un colosse à la mémoire d’argile. Il retient tout très vite et oublie tout illico, ou presque. Les banques magnétiques résistent quelques dizaines d’années à peine. Un disque audio ou vidéo ne semble plus fiable après une décennie et ce serait encore pire avec les DVD Blu-ray et les clés USB. Finalement, dans toute son histoire, l’humanité n’a pas utilisé de techniques de conservation des informations aussi instables.
 
Cette grande fragilité des supports numériques renverse la perspective des archivistes sur les trésors dont ils ont la garde. « Il faut maintenant protéger les documents les plus récents avant de protéger les plus anciens », résume le directeur général de la conservation de BAnQ. Des documents de plusieurs milliers d’années, comme les tablettes d’argile ou les papyrus, résistent au temps et vont résister encore longtemps, tandis que des enregistrements réalisés il y a une décennie pourraient disparaître à jamais. »
 
Trouble de mémoire

La Library of Congress, la bibliothèque nationale des États-Unis, vient de déposer un plan pour la protection du patrimoine musical américain. Le mot d’ordre des 32 recommandations concerne la numérisation des supports les plus fragiles peu importe leur âge, des rouleaux de cire aux cassettes huit pistes. Certains trésors inestimables sont déjà passés à la trappe, des enregistrements des jeunes Frank Sinatra ou Judy Garland par exemple, les transmissions du cockpit de l’Enola Gay après le largage de la bombe atomique sur Hiroshima et même les bandes originales des échanges entre le module lunaire d’Apollo 11 et Cap Canaveral.
 
Il y a des exemples de destructions tragiques ici aussi, notamment en audiovisuel, les télés et les radios ayant bousillé une bonne part de leurs archives. Les efforts de protection n’en demeurent pas moins profonds et réels. BAnQ a numérisé et diffuse en ligne le contenu de tous ses vieux rouleaux de cire encore lisibles, au total 222 des 234 précieux supports de sa collection. L’institution québécoise s’attaque maintenant à des disques radiophoniques de très grands formats et vient de dénicher un appareil pour les lire (voir l’encadré).
 
L’UNESCO a organisé une conférence internationale sur le thème de « la mémoire du monde à l’ère numérique » à Vancouver en septembre dernier. Le directeur Ferland y était. « Nous sommes revenus de Vancouver avec de bonnes questions pour orienter notre politique de numérisation, explique-t-il. Nous nous sommes aussi appuyés sur les travaux pionniers d’institutions sœurs, la Library of Congress et la Bibliothèque nationale de France [BNF]. Tout est en construction dans ce monde où il faut par exemple décider de normes et ensuite tenter de les faire adopter à l’échelle internationale. »
 
C’est le cas avec les langages d’encodage et la structuration des textes comme des images. Comme la BNF, BAnQ utilise le format ALTO (Analysed Layout and Text Object) pour la conversion des textes à partir des images, qui permet notamment la surbrillance des mots recherchés lors d’une requête. La BNF a aussi prêté à sa sœurette nord-américaine une spécialiste de la numérisation qui a passé des semaines à analyser, critiquer et réorienter les pratiques québécoises.
 
La direction de la numérisation de BAnQ compte 17 employés sous la gouverne de Tristan Müller. L’objectif est de numériser l’ensemble du patrimoine documentaire publié depuis le XVIIe siècle ou d’origine étrangère mais relatif au Québec. Le corpus couvre toutes les catégories, les ouvrages imprimés comme les manuscrits, la photo comme les enregistrements sonores. Sitôt dématérialisées, si les droits d’auteur le permettent, les informations sont mises en ligne, au bénéfice de tous.
 
L’argent et la technologie font alliance dans cette guerre contre l’oubli. Le budget annuel total de l’institution québécoise oscille autour de 60 millions de dollars. Bon an, mal an, la numérisation en accapare 2 millions. « C’est un bon rapport, juge le directeur Ferland. Il faut en plus considérer que nous numérisons des documents déjà protégés dans nos collections. »
 
Pour l’instant, le Québec offre très peu d’exemples de partenariat public-privé comme ceux développés ailleurs (voir l’encadré). Le projet Éléphant de « mémoire du cinéma québécois » constitue une exception remarquable. Soutenu entièrement par Québecor, le programme vise la numérisation de toute la production cinématographique nationale. Environ 150 films ont été nettoyés et reportés sur support numérique depuis 2008. La plateforme Illico permet de les visionner sur demande.
 
Le champ à couvrir s’étend sans cesse. La Library of Congress recense maintenant les messages sur les réseaux sociaux. BAnQ s’efforce de moissonner Internet pour y recueillir des informations très souvent uniquement disponibles en ligne. Les robots de l’institution passent le râteau virtuel une fois par mois dans plus de 500 sites identifiés comme significatifs. Aux dernières élections, la mécanique a par exemple systématisé les relevés auprès de sites d’informations, mais aussi de lieux centraux de la démocratie, comme l’Assemblée nationale.
 
Il n’y a pas d’obligations légales de collaborer, mais le directeur Ferland explique qu’il n’a essuyé jusqu’ici qu’un seul refus. Il souhaite faire changer certains règlements sur le dépôt légal pour faciliter le moissonnage tout en limitant dans certains cas la diffusion des informations engrangées sur ses serveurs.
 
Le stockage lui-même pose de nouveaux défis surprenants. Google prend le soin de renouveler ses serveurs tous les quatre ans tout au plus. Les grands centres d’archives doivent protéger leurs mémoires numériques en s’échangeant des copies de sécurité des disques durs capables de stocker des péta, des exa et des zettabits comme elles troquaient autrefois de bons vieux microfilms produits par les machines Allen…

***

Recherche vieux appareils désespérément


Écrire, puis lire. Une fois l’information emprisonnée sur un support, il faut la libérer en la lisant, ce qui ne s’avère pas toujours reposant. Pour décrypter ses quelque 222 rouleaux de cire centenaires, le Centre de conservation de BAnQ a utilisé un appareil bricolé par un ingénieur français à partir des pièces d’un tourne-disque.


Les disques radiophoniques, des galettes en vinyle de la taille d’une grande pizza, posent un nouveau défi. Ils sont fragiles et ne résistent pas à de nombreuses lectures. Le tourne-disque surdimensionné capable de les faire jouer, un appareil unique au Québec, a été emprunté au Musée de la civilisation de Québec. Les disques fragiles servaient à enregistrer les feuilletons radio et d’autres émissions à rediffuser dans les années 1930 et 1940.


Les bandes magnétiques s’avèrent encore plus capricieuses. En situation de parfaite conservation, elles peuvent résister un peu plus de trois décennies, aussi bien dire une fraction de seconde à l’échelle du temps long. La lecture des cassettes audio ou vidéo pose déjà d’énormes défis aux conservateurs, qui recherchent désespérément certains appareils pour décoder les bandes d’un demi-pouce ou d’un pouce, mais aussi des cartouches huit pistes, les « cart machines » populaires des années 1960 à 1980. « Nous sommes à la merci de l’obsolescence des supports et des appareils », explique Tristan Müller, directeur de la numérisation de BAnQ, qui fait appel à la générosité du public pour recevoir des instruments technologiques de lecture rares ou disparus. « Quand un appareil brise, on panique et on se sent vraiment démuni. »

***
 

Collection publique, numérisation privée

La dématérialisation coûte cher et l’argent manque à la plupart des institutions publiques qui conservent de très riches collections du patrimoine mondial. D’où les accords de partenariat avec certaines entreprises privées du Net prêtes à numériser les documents pour les mettre à la disposition du public tout en tirant profit de leur exploitation commerciale.
 

La Bibliothèque nationale de France a franchi le seuil des deux millions de documents numérisés à la mi-décembre. On y retrouve 400 000 livres, 975 000 fascicules, 60 000 cartes, 31 000 manuscrits, 10 000 partitions et 2400 enregistrements, tous accessibles sur Gallica. Il en reste encore environ 13 millions à traiter. Avec un budget d’environ 10 millions de dollars par année consacré à la numérisation, il faudrait 20 ans pour en venir à bout.
 

Pour accélérer le processus, l’institution a lancé un « appel à des partenariats privés » en juillet 2011. Les deux premiers accords ont été signés à la mi-janvier 2013. L’entente avec la société française Believe Digital et la belge Memnon Archiving prévoit la numérisation de quelque 200 000 vinyles. L’autre entente, passée avec la société américaine Proquest, vise la dématérialisation d’environ 70 000 titres anciens publiés entre 1470 et 1700. En échange, Proquest peut exploiter commercialement presque tout le catalogue (sauf 3500 ouvrages en accès libre) pendant 10 ans. Cet accord s’inscrit dans un programme européen consacré à l’élaboration d’une bibliothèque virtuelle antérieure au XVIIIe siècle.
 

Les militants de la libre circulation des connaissances dans l’univers numérique ont décrié ces partenariats. L’Association des bibliothécaires de France a réclamé la publication du détail des accords et « la suppression de toute clause réduisant la communication des œuvres concernées à une prestation marchande, quel qu’en soit le bénéficiaire ».

6 commentaires
  • Pierre-R. Desrosiers - Inscrit 9 mars 2013 07 h 40

    La pierre

    Finalement, une seule mémoire a su traverser les siècles: celle de la pierre.

    Dur.

    Desrosiers
    Val David

    • Georges Washington - Inscrit 9 mars 2013 12 h 57

      Même pas, il était un peu abusif de dire que les tablettes d'argile et le papyrus sont supérieurs au niveau de la conservation. Combien de tablettes et de papyrus inestimables disparus depuis que le monde est monde? La petite fraction que nous possédons présentement ne nous permet pas de conclure que ce médium est supérieur à un autre.

      De plus, il ne faut pas non plus penser que les parcs de disques sur lesquels sont numérisés les documents ne sont jamais remplacés. Au fur et à mesure que la technologie avance, il devient un peu ridicule de conserver dans une pièce de 100 m² ce qui pourrait être contenu sur un seul disque. Donc, en principe, les fichiers d'archives sont recopiés sur des disques plus récents de façon routinière et bien avant que les disques ne tombent en panne.

  • Christian Martin - Inscrit 9 mars 2013 08 h 26

    1984 George Orwell

    Je lis, ces articles sur l'archivage et je ne peux m'empêcher de faire le lien avec le traitement de contenu du livre 1984 de Georges Orwell. Mais cette fois-ci, il semble que la machine le fait elle-même! Le danger de perdre la mémoire collective et la perspective de l'histoire faute de document de référence....

  • Pierre Bouillon - Abonné 9 mars 2013 09 h 33

    Un article intéressant

    Cet article de Stéphane Baillargeon est fort intéressant. On fait bien sentir la fragilité des enregistrements modernes et la durabilité des anciens documents (tablettes d'argyle, papyrus...). Je le dis en souriant, il faudra peut-être opposer bientôt la durabilité du livre imprimé sur papier et la relative fragilité du livre numérique! Une question: on dit dans l'article que "...les CD décèdent et les DVD se vident". Je n'ai jamais rencontré un tel problème. J'ai des CD achetés au début des années '80 et il me semble qu'ils jouent aussi bien qu'au premier jour. Pourrait-on mieux documenter cette fragilité des CD ou des DVD? Je crains plus la relative rareté, dans les prochaines années, des appareils qui accepteront de jouer les "vieux" CD ou DVD. Essayez, aujourd'hui, d'acheter un nouveau projecteur de diapositives ou de remplacer sa lampe...
    Cordialement,
    Pierre Bouillon

  • Pierre Perrault - Inscrit 12 mars 2013 20 h 24

    Les dinosaures du numérique...

    Monsieur Baillargeon, votre résumé de la situation après consultation d' experts du Centre de conservation de Bibliothèque et Archives nationales du Québec (BAnQ) est plutôt rigolo, simpliste et me laisse perplexe. Il serait intéressant de lire une entrevue avec monsieur Henry Wilhelm et madame Carol Brower Wilhelm. Ces deux experts œuvrent depuis de nombreuses années dans le milieu de la conservation.
    http://wilhelm-research.com/about_us.html
    http://wilhelm-research.com/book.html
    http://wilhelm-research.com/subzero.html
    Dinosaures et disques de toutes sortes qui ramollissent... Pas pire, pas pire...
    Cela dit, je ne suis pas tout à fait convaincu que les employés qui faisaient du microfilmage travaillaient à l'aveuglette.

  • Dany Attal - Inscrite 12 mars 2013 21 h 42

    Microfilms

    M.Baillargeon, je suis très surprise par votre article qui va dans tous les sens: je crois que vous manquez d'informations sérieuses.
    Sachez qu'un microfilm bien conservé dure entre 400 et 500 ans.
    De plus, ce sont des professionels de laboratoires photographiques qui les font, suivant des normes très strictes et sûrement pas à l'aveuglette.
    Quant au DVD qui devient mou...