Préserver le patrimoine scientifique francophone

Jean-Benoît Nadeau
Collaboration spéciale
Environ 3% des archives et 14% du contenu de la Bibliothèque nationale sont numérisés.
Photo: Valérian Mazataud Le Devoir Environ 3% des archives et 14% du contenu de la Bibliothèque nationale sont numérisés.

Ce texte fait partie du cahier spécial 100 ans de l'Acfas

Le destin du Québec moderne est intrinsèquement lié à la science et à la recherche. Il n’y aurait sans doute jamais eu de Révolution tranquille sans cette poignée de pionniers tels le botaniste Marie-Victorin, le radiologiste Léo Pariseau, l’écologiste Pierre Dansereau, mais aussi la naturaliste Marcelle Gauvreau. Ensemble ou séparément, ils ont repoussé les limites du savoir, jeté les bases d’universités modernes et francophones et organisé la vie associative scientifique.

« Nos documents reflètent l’explosion de la recherche au Canada français », dit Maureen Clapperton, directrice générale de la Bibliothèque nationale à Bibliothèque et Archives nationales du Québec (BAnQ). « On y voit très bien ce qui se passait en sciences sociales, en sciences appliquées, mais aussi la mise en place des grands services publics. »

La préservation du patrimoine scientifique québécois est une responsabilité partagée, selon Cédric Champagne, directeur du Service des archives et de gestion des documents de l’UQAM. Alors que la Bibliothèque nationale reçoit les exemplaires de toutes les publications, sous forme de livres, de revue ou de journal — papier ou électronique —, les services d’archives comme le sien doivent gérer des quantités importantes de documents institutionnels et privés émanant de grands chercheurs, mais aussi d’organismes aussi variés que l’Acfas ou la Société canadienne d’histoire naturelle. « Au moment où nous avons pris les archives de l’Acfas, en 1981, dit-il, notre recteur disait déjà qu’on ne pourrait plus faire l’histoire des sciences sans passer par les associations. »

« Et c’est un patrimoine qui se constitue à mesure », explique Vincent Larivière, directeur scientifique d’Érudit, la plateforme Web qui regroupe notamment les publications en français au Québec dans le domaine des sciences humaines et sociales, ainsi que celles du reste du Canada et d’ailleurs, pour un total d’environ 250 000 articles disponibles depuis sa fondation en 1998. « Les articles en sciences sociales ont une demi-vie beaucoup plus longue que les articles en sciences naturelles. »

Un effort collectif

 

C’est tout cela mis ensemble — BAnQ, les archives universitaires, Érudit — qui constitue la mémoire scientifique collective du Québec. « Chez les anglophones, le patrimoine scientifique, notamment les publications, est la propriété de grands éditeurs commerciaux, alors que chez les francophones, c’est davantage considéré comme un bien public », dit Vincent Larivière.

Pour illustrer la collaboration et la complémentarité entre les divers organismes, Cédric Champagne cite le cas des archives de l’Acfas, partagées entre BAnQ et l’UQAM.

C’est BAnQ qui recueille toutes les publications de l’Acfas depuis ses débuts, aussi bien les Annales de l’Acfas, de 1935 à 1995, que le Bulletin de l’Acfas de 1959 à 1983, la revue Le Jeune Scientifique de 1962 à 1969 ou Interface de 1984 à 2000. L’UQAM, quant à elle, gère plutôt le matériel hétéroclite concernant la vie de l’organisation : procès-verbaux de réunions, plans stratégiques, bottins des membres, sections régionales, gestion des prix, les avis et mémoires présentés, les lettres patentes, les photos, les correspondances avec les associations, leurs projets communs, les programmes, cocardes et écussons des congrès, jusqu’aux menus de banquets.

C’est d’ailleurs à la suite d’un effort concerté de BAnQ et de l’UQAM que le fonds de l’Acfas a intégré le Registre de la Mémoire du monde du Canada, géré par la Commission canadienne de l’UNESCO, en 2022. « C’est l’aboutissement d’un long processus, très sévère. Mais cette inscription reconnaît la très grande valeur de ce corpus. Ce sont des documents uniques dont il faut prendre soin », dit Cédric Champagne.

Ce travail de conservation est d’autant plus nécessaire qu’aucun archiviste ou aucun bibliothécaire ne peut présumer des recherches qui seront faites demain, explique Maureen Clapperton. Il y a quelques décennies, personne n’aurait pu prévoir que tout serait actuellement réanalysé sous l’optique de l’accès des femmes, du développement durable ou de la place des Autochtones dans la société. « Les mouvances générationnelles font qu’on ne sait jamais à quoi serviront nos corpus. »

Le défi de la numérisation

 

Ce patrimoine intéresse au premier chef les historiens, les chercheurs et des étudiants, mais Érudit et BAnQ ont aussi pour mission de répondre aux demandes du grand public. « C’est pour ça qu’on accompagne beaucoup les utilisateurs, précise Maureen Clapperton. Nous avons des spécialistes des cartes anciennes, mais aussi des imprimés, des magazines spécialisés, des estampes, des livres d’artistes. »

À BAnQ, environ 3 % des archives et 14 % du contenu de la Bibliothèque nationale sont numérisés — un travail énorme qui exige souvent une restauration préalable afin de simplement manipuler ou nettoyer des documents que le temps a rendus friables ou illisibles.

« Contrairement à Bibliothèque et Archives Canada, qui numérise pour la conservation, BAnQ numérise pour la diffusion, c’est un défi supplémentaire. Et c’est pourquoi nous avons reçu des tonnes de remerciements depuis la pandémie pour tout ce que nous avons fait. »

Le défi de la découvrabilité

 

À l’heure du Web, l’un des gros défis du patrimoine scientifique est son accessibilité et sa découvrabilité. C’est d’ailleurs la vocation première de la plateforme Érudit.

« On travaille les métadonnées de qualité pour un bon référencement, explique Vincent Larivière. On doit s’assurer que nos articles seront détectés par les algorithmes de Google et des autres moteurs de recherche. Ça prend des hyperliens, par exemple, mais aussi des notes, des sources dans des formes reconnaissables par les moteurs. »

Ce travail de mise en forme donne de gros résultats : le nombre d’utilisateurs d’Érudit a presque doublé depuis 2018 pour atteindre les 5,6 millions, pour un total de 33 millions de pages vues en 2021 dans une centaine de pays. Et 75 % des demandes viennent de l’étranger, de la France (21 %) et des États-Unis (14 %).

Érudit travaille actuellement en collaboration avec BAnQ pour convertir les vieux fichiers numérisés en PDF aux formats XML ou HTML. « On fait l’indexation rétrospective. L’idée est que le document ancien soit aussi bien structuré que l’article courant pour qu’il sorte parmi les premiers résultats du moteur de recherche plutôt qu’en page 17. »

Pour les archives, ce défi d’accessibilité se situe dans une tout autre sphère puisqu’il consiste d’abord en un travail d’organisation physique des caisses de documents. Rien que pour les Cercles des jeunes naturalistes, organisme fondé en 1931 par le frère Adrien Rivard, cela représente l’équivalent de 70 caisses sur 22 mètres de tablette. Mais le problème est le même pour tous les fonds d’organismes, de chercheurs ou ceux des institutions. « Il y a un ménage à faire, pour éviter les doublons, par exemple, et pour tout placer en ordre. Ensuite, tout se joue dans la description détaillée du matériel que nous avons. C’est comme ça qu’on donne du sens au patrimoine scientifique. »

À voir en vidéo