Passer à la version normale du sitePasser à la version large du siteTaille d'écran
  • Facebook
  • Twitter
  • RSS
  • fermer

    Connexion au Devoir.com

    Mot de passe oublié?
    Abonnez-vous!

    Humanités 2.0 - Les mots pour le dire

    Usito propose le premier dictionnaire du français au Québec entièrement dématérialisé

    Avec Usito, « c’est la première fois dans la francophonie qu’un dictionnaire est produit dans un environnement entièrement numérique », explique Hélène Cajolet-Laganière, professeure au Département des lettres et communications de l’Université de Sherbrooke.
    Photo : Pedro Ruiz - Le Devoir Avec Usito, « c’est la première fois dans la francophonie qu’un dictionnaire est produit dans un environnement entièrement numérique », explique Hélène Cajolet-Laganière, professeure au Département des lettres et communications de l’Université de Sherbrooke.

    Les nouvelles technologies transforment la production et la diffusion des savoirs. Le Devoir propose une série estivale sur les digital humanities et les sciences sociales numériques. Aujourd’hui : l’informatique au service de la lexicographie.

     

    Qu’est-ce qu’un bleuet ? Le bon vieux Petit Robert en papier dit que le mot désigne :

     

    1. Une « centaurée à fleur bleue, commune dans les blés » ;

     

    2. Un régionalisme du Canada désignant la « baie bleue de l’airelle des bois, ou myrtille d’Amérique ».

     

    Très bien. Ça se tient.

     

    Le nouveau dictionnaire québécois Usito, disponible en ligne depuis quelques semaines, propose plutôt :

     

    1. « Nom donné aux centaurées à capitules bleus, en particulier à la centaurée bleuet » ;

     

    2. «Baie d’un bleu noirâtre, à saveur douce et acidulée, que produisent diverses espèces d’airelles à port dressé, notamment des espèces indigènes de l’est de l’Amérique du Nord».

     

    Exit le régionalisme et bonjour la réalité québécoise.

     

    Le site aligne en plus les expressions bien d’ici, « talle de bleuets » ou « confiture de bleuets » ; ajoute une citation de Félix-Antoine Savard ; termine avec cette autre définition de Bleuet (avec une majuscule cette fois) :

     

    3. « Surnom des habitants de la région du Saguenay -Lac-Saint-Jean, reconnue pour sa production de bleuets. » Une citation tirée du Droit appuie cet usage. Bien vu. Merci. Au suivant.

     

    On peut poursuivre l’exercice de comparaison avec d’autres petits fruits. Sous framboise, il est question du « casseau ». Sous fraise, on retrouve une citation d’Anne Hébert et l’explication de la délicieuse expression « se paqueter la fraise », incompréhensible pour un Français ou un Gabonais fraîchement débarqué de ce côté-ci de l’Atlantique Nord.

     

    « Usito s’appuie entièrement sur les nouveaux outils technologiques, explique Hélène Cajolet-Laganière, professeure au Département des lettres et communications de l’Université de Sherbrooke (UdeS). C’est la première fois dans la francophonie qu’un dictionnaire est produit dans un environnement entièrement numérique. À partir du moment où on a mis un premier mot dans la base de données textuelle jusqu’aux ajouts et correctifs en ligne qui se poursuivent aujourd’hui, tout a été dématérialisé. Au départ, on pensait même imprimer une version à partir de notre base mouvante. On a abandonné ce projet. Le site est bien plus pratique. »

     

    Tout recommencer

     

    Un célèbre prédécesseur, Adjutor Rivard, premier linguiste québécois, exprimait déjà le souhait d’une description de la langue française utilisée au Canada il y a tout juste 100 ans. Certains beaux ouvrages, le Dictionnaire québécois d’aujourd’hui ou le Dictionnaire du français plus, s’approchent du but, mais en adaptant les productions françaises, « excellentes, mais faites par et pour des Français », dit la professeure.

     

    « Ces ouvrages de référence ajoutent des régionalismes belges ou québécois, enchaîne-t-elle. Ils citent moins d’une centaine d’auteurs d’ici. Josette Rey-Debove [1929-2005], coauteure du Robert, avait dit que, pour mettre au point un dictionnaire québécois qui réponde à nos besoins, il fallait recommencer le travail à zéro. »

     

    La linguiste s’est donc attaquée à la tâche colossale, avec son collègue Pierre Martel, ancien président du CLF. Ensemble, ils ont fondé le groupe de recherche FRANQUS (Français québécois : usage standard) au sein du vénérable Centre d’analyse et de traitement informatique du français québécois (CATIFQ) de l’Université de Sherbrooke (UdeS). Ce groupe a pour objectif « de recenser et de décrire le français contemporain d’usage public au Québec ».

     

    Pour trouver le vocabulaire à définir et exemplifier, il fallait d’abord constituer une banque de textes. Le corpus numérisé comprend maintenant quelque 52 millions de mots tirés de la littérature (romans, poèmes, nouvelles), des médias, de la science et des techniques (aluminerie, aéronautique, hydroélectricité, etc.), de l’économie, de la justice, des universités (revues savantes, mémoires et thèses) et même des corpus oraux.

     

    Ces mots ont ensuite été indexés et lemmatisés (en déclinant toute la conjugaison d’un verbe par exemple). Un moteur de recherche a permis de codifier les compositions (pêcher la truite, truite mouchetée, grise, etc.) et de retrouver des citations utiles. La numérisation facilite aussi la comparaison entre les dictionnaires existants.

     

    Tout payer

     

    L’Usito (un nom choisi par une firme spécialisée…) rassemble plus de 60 000 mots et 100 000 emplois, dont 10 000 propres au Québec. On y retrouve plus de 36 000 citations.

     

    « Nous travaillons dans un univers sans papier, dit fièrement la spécialiste. Il n’y a pas de limite non plus sur les écrans. Nous avons pu inclure environ 6000 tableaux de conjugaison. »

     

    Le bel ouvrage se publicise avec cette formule : « Parce que le français ne s’arrête jamais ». Quand la ville de Québec a été frappée par la maladie du légionnaire, l’ouvrage de référence a ajouté « légionellose » à son corpus dématérialisé, malléable à souhait.

     

    « C’est un lecteur qui nous l’a suggéré, mais Usito n’est pas Wikipédia, dit la professeure. Les usagers ne construisent pas les articles. Nous avons une équipe éditoriale et nous construisons notre corpus de manière scientifique. »

     

    Au plus fort, une trentaine de personnes ont travaillé sur l’ouvrage, qui a nécessité environ 10 millions de dollars, que de l’argent public. Alors, pourquoi faire payer les abonnements (jusqu’à 60 $ pas année), d’autant plus qu’Usito utilise des logiciels libres ?

     

    « Tout ça appartient à l’université et nous avons cédé tous nos droits d’auteurs, répond la professeure. Il y a quelques années, quand le travail s’étendait, l’UdeS a eu la gentillesse de nous soutenir jusqu’au lancement. Mais elle nous a obligés à rentabiliser le dictionnaire pour la suite de son développement. »

     

    La compagnie des éditions Delisme gère maintenant le dictionnaire. La linguiste souligne que l’abonnement peut coûter aussi peu que 30 cents par étudiant si un collège abonne ses élèves en groupe, par exemple. Elle rappelle que d’autres équipes universitaires québécoises, dont Le trésor de la langue française à Québec et un projet de dictionnaire bilingue à Ottawa, n’ont jamais abouti malgré des décennies de boulot et des sommes colossales. « Nous, on a terminé, on est en ligne et il faut accepter certaines contraintes.»

     

    Tout considérer

     

    Le site fournit à l’usager des outils très simples et très utiles, par exemple pour distinguer les usages ici et d’ailleurs ou pour tolérer une marge d’erreur orthographique lors de la consultation, comme sur tout bon moteur de recherche. Ainsi, il suffit de taper « amfitrion » pour être renvoyé à « amphitryon ».

     

    « Chaque fois, nous partons du tronc commun de la francophonie et nous identifions les particularités », dit Mme Cajolet en fournissant des exemples. La banque de données a montré que « peaufiner » ne pouvait être classifié comme « familier » et que plusieurs anglicismes n’en sont pas.

     

    On peut aussi causer laitue. La base de la définition paraît pour ainsi dire universelle. Les ramifications permettent par contre de distinguer la batavia d’Europe de la boston ou de l’iceberg du Nouveau Monde. Aucun dictionnaire franco-français ne permet de démêler ces feuilles.

     

    « C’est la même chose avec la féminisation, dit la linguiste. On fait remarquer que sculpteure est en usage au Québec. Mais nous ne sommes pas un organisme normatif. Quand on traite de best-seller, on souligne que le mot parfois critiqué est passé dans l’usage standard. C’est la même chose avec “prioriser”. On relaie la norme telle qu’elle se manifeste dans les textes soignés, avec des québécismes de bon aloi, par exemple ceux qui sont bien employés dans Le Devoir ou L’actualité. »

     

    Les tensions entre les « aménagistes » (ou endogénistes) et les « internationalisants » (ou exogénistes) se manifestent. Pour ses détracteurs, Usito serait du premier bord, en contribuant à affirmer une norme autonome pour le français du Québec.

     

    « C’est bien injuste de nous accuser de séparatisme linguistique, répond la professeure. Nous prônons au contraire une ouverture sur le monde. En plus, nous ne sommes pas un organisme normatif. On ne dit pas de dire ou de ne pas dire ceci ou cela. Mais on dit ce qui se dit ici. Je le répète : le Québec n’est pas dans Le Larousse ou Le Robert, où le bleuet est “une myrtille d’Amérique”, une affaire réglée en une ligne. »

     

     

     
     
    Édition abonné
    La version longue de certains articles (environ 1 article sur 5) est réservée aux abonnés du Devoir. Ils sont signalés par le symbole suivant :
     
     












    CAPTCHA Image Générer un nouveau code

    Envoyer
    Fermer
    Blogues
    Articles les plus : Commentés|Aimés
    Abonnez-vous pour recevoir nos Infolettres par courriel