Humanités 2.0 - Les mots pour le dire

Avec Usito, « c’est la première fois dans la francophonie qu’un dictionnaire est produit dans un environnement entièrement numérique », explique Hélène Cajolet-Laganière, professeure au Département des lettres et communications de l’Université de Sherbrooke.
Photo: Pedro Ruiz - Le Devoir Avec Usito, « c’est la première fois dans la francophonie qu’un dictionnaire est produit dans un environnement entièrement numérique », explique Hélène Cajolet-Laganière, professeure au Département des lettres et communications de l’Université de Sherbrooke.

Les nouvelles technologies transforment la production et la diffusion des savoirs. Le Devoir propose une série estivale sur les digital humanities et les sciences sociales numériques. Aujourd’hui : l’informatique au service de la lexicographie.

 

Qu’est-ce qu’un bleuet ? Le bon vieux Petit Robert en papier dit que le mot désigne :

 

1. Une « centaurée à fleur bleue, commune dans les blés » ;

 

2. Un régionalisme du Canada désignant la « baie bleue de l’airelle des bois, ou myrtille d’Amérique ».

 

Très bien. Ça se tient.

 

Le nouveau dictionnaire québécois Usito, disponible en ligne depuis quelques semaines, propose plutôt :

 

1. « Nom donné aux centaurées à capitules bleus, en particulier à la centaurée bleuet » ;

 

2. «Baie d’un bleu noirâtre, à saveur douce et acidulée, que produisent diverses espèces d’airelles à port dressé, notamment des espèces indigènes de l’est de l’Amérique du Nord».

 

Exit le régionalisme et bonjour la réalité québécoise.

 

Le site aligne en plus les expressions bien d’ici, « talle de bleuets » ou « confiture de bleuets » ; ajoute une citation de Félix-Antoine Savard ; termine avec cette autre définition de Bleuet (avec une majuscule cette fois) :

 

3. « Surnom des habitants de la région du Saguenay -Lac-Saint-Jean, reconnue pour sa production de bleuets. » Une citation tirée du Droit appuie cet usage. Bien vu. Merci. Au suivant.

 

On peut poursuivre l’exercice de comparaison avec d’autres petits fruits. Sous framboise, il est question du « casseau ». Sous fraise, on retrouve une citation d’Anne Hébert et l’explication de la délicieuse expression « se paqueter la fraise », incompréhensible pour un Français ou un Gabonais fraîchement débarqué de ce côté-ci de l’Atlantique Nord.

 

« Usito s’appuie entièrement sur les nouveaux outils technologiques, explique Hélène Cajolet-Laganière, professeure au Département des lettres et communications de l’Université de Sherbrooke (UdeS). C’est la première fois dans la francophonie qu’un dictionnaire est produit dans un environnement entièrement numérique. À partir du moment où on a mis un premier mot dans la base de données textuelle jusqu’aux ajouts et correctifs en ligne qui se poursuivent aujourd’hui, tout a été dématérialisé. Au départ, on pensait même imprimer une version à partir de notre base mouvante. On a abandonné ce projet. Le site est bien plus pratique. »

 

Tout recommencer

 

Un célèbre prédécesseur, Adjutor Rivard, premier linguiste québécois, exprimait déjà le souhait d’une description de la langue française utilisée au Canada il y a tout juste 100 ans. Certains beaux ouvrages, le Dictionnaire québécois d’aujourd’hui ou le Dictionnaire du français plus, s’approchent du but, mais en adaptant les productions françaises, « excellentes, mais faites par et pour des Français », dit la professeure.

 

« Ces ouvrages de référence ajoutent des régionalismes belges ou québécois, enchaîne-t-elle. Ils citent moins d’une centaine d’auteurs d’ici. Josette Rey-Debove [1929-2005], coauteure du Robert, avait dit que, pour mettre au point un dictionnaire québécois qui réponde à nos besoins, il fallait recommencer le travail à zéro. »

 

La linguiste s’est donc attaquée à la tâche colossale, avec son collègue Pierre Martel, ancien président du CLF. Ensemble, ils ont fondé le groupe de recherche FRANQUS (Français québécois : usage standard) au sein du vénérable Centre d’analyse et de traitement informatique du français québécois (CATIFQ) de l’Université de Sherbrooke (UdeS). Ce groupe a pour objectif « de recenser et de décrire le français contemporain d’usage public au Québec ».

 

Pour trouver le vocabulaire à définir et exemplifier, il fallait d’abord constituer une banque de textes. Le corpus numérisé comprend maintenant quelque 52 millions de mots tirés de la littérature (romans, poèmes, nouvelles), des médias, de la science et des techniques (aluminerie, aéronautique, hydroélectricité, etc.), de l’économie, de la justice, des universités (revues savantes, mémoires et thèses) et même des corpus oraux.

 

Ces mots ont ensuite été indexés et lemmatisés (en déclinant toute la conjugaison d’un verbe par exemple). Un moteur de recherche a permis de codifier les compositions (pêcher la truite, truite mouchetée, grise, etc.) et de retrouver des citations utiles. La numérisation facilite aussi la comparaison entre les dictionnaires existants.

 

Tout payer

 

L’Usito (un nom choisi par une firme spécialisée…) rassemble plus de 60 000 mots et 100 000 emplois, dont 10 000 propres au Québec. On y retrouve plus de 36 000 citations.

 

« Nous travaillons dans un univers sans papier, dit fièrement la spécialiste. Il n’y a pas de limite non plus sur les écrans. Nous avons pu inclure environ 6000 tableaux de conjugaison. »

 

Le bel ouvrage se publicise avec cette formule : « Parce que le français ne s’arrête jamais ». Quand la ville de Québec a été frappée par la maladie du légionnaire, l’ouvrage de référence a ajouté « légionellose » à son corpus dématérialisé, malléable à souhait.

 

« C’est un lecteur qui nous l’a suggéré, mais Usito n’est pas Wikipédia, dit la professeure. Les usagers ne construisent pas les articles. Nous avons une équipe éditoriale et nous construisons notre corpus de manière scientifique. »

 

Au plus fort, une trentaine de personnes ont travaillé sur l’ouvrage, qui a nécessité environ 10 millions de dollars, que de l’argent public. Alors, pourquoi faire payer les abonnements (jusqu’à 60 $ pas année), d’autant plus qu’Usito utilise des logiciels libres ?

 

« Tout ça appartient à l’université et nous avons cédé tous nos droits d’auteurs, répond la professeure. Il y a quelques années, quand le travail s’étendait, l’UdeS a eu la gentillesse de nous soutenir jusqu’au lancement. Mais elle nous a obligés à rentabiliser le dictionnaire pour la suite de son développement. »

 

La compagnie des éditions Delisme gère maintenant le dictionnaire. La linguiste souligne que l’abonnement peut coûter aussi peu que 30 cents par étudiant si un collège abonne ses élèves en groupe, par exemple. Elle rappelle que d’autres équipes universitaires québécoises, dont Le trésor de la langue française à Québec et un projet de dictionnaire bilingue à Ottawa, n’ont jamais abouti malgré des décennies de boulot et des sommes colossales. « Nous, on a terminé, on est en ligne et il faut accepter certaines contraintes.»

 

Tout considérer

 

Le site fournit à l’usager des outils très simples et très utiles, par exemple pour distinguer les usages ici et d’ailleurs ou pour tolérer une marge d’erreur orthographique lors de la consultation, comme sur tout bon moteur de recherche. Ainsi, il suffit de taper « amfitrion » pour être renvoyé à « amphitryon ».

 

« Chaque fois, nous partons du tronc commun de la francophonie et nous identifions les particularités », dit Mme Cajolet en fournissant des exemples. La banque de données a montré que « peaufiner » ne pouvait être classifié comme « familier » et que plusieurs anglicismes n’en sont pas.

 

On peut aussi causer laitue. La base de la définition paraît pour ainsi dire universelle. Les ramifications permettent par contre de distinguer la batavia d’Europe de la boston ou de l’iceberg du Nouveau Monde. Aucun dictionnaire franco-français ne permet de démêler ces feuilles.

 

« C’est la même chose avec la féminisation, dit la linguiste. On fait remarquer que sculpteure est en usage au Québec. Mais nous ne sommes pas un organisme normatif. Quand on traite de best-seller, on souligne que le mot parfois critiqué est passé dans l’usage standard. C’est la même chose avec “prioriser”. On relaie la norme telle qu’elle se manifeste dans les textes soignés, avec des québécismes de bon aloi, par exemple ceux qui sont bien employés dans Le Devoir ou L’actualité. »

 

Les tensions entre les « aménagistes » (ou endogénistes) et les « internationalisants » (ou exogénistes) se manifestent. Pour ses détracteurs, Usito serait du premier bord, en contribuant à affirmer une norme autonome pour le français du Québec.

 

« C’est bien injuste de nous accuser de séparatisme linguistique, répond la professeure. Nous prônons au contraire une ouverture sur le monde. En plus, nous ne sommes pas un organisme normatif. On ne dit pas de dire ou de ne pas dire ceci ou cela. Mais on dit ce qui se dit ici. Je le répète : le Québec n’est pas dans Le Larousse ou Le Robert, où le bleuet est “une myrtille d’Amérique”, une affaire réglée en une ligne. »

 

 

8 commentaires
  • Paul Michaud - Abonné 10 août 2013 08 h 17

    Usito-enfin

    Les dictionnaires français sont composés dans la capitale française pour les français, point à la ligne.
    Il y a 65 millions de français en France, mais des centaines de millions de francophones à travers le monde; comment expliquer qu'il n'y ait qu'une poignée de mots venant des autres cultures. Le dictionnaire français ne se veut pas inclusif, il est aristocratique, comme l'allemand d'ailleurs, et a l'opposé de l'anglais ou de l'espagnol qui eux sont beaucoup plus inclusifs.

    • Frédéric Chiasson - Inscrit 10 août 2013 13 h 07

      Anglais et espagnol beaucoup plus inclusif? Je ne suis pas linguiste, mais je parle et j'écris plusieurs langues. Je n'oserais donc pas dire que l'anglais et l'espagnol soient «beaucoup plus inclusifs» que le français et l'allemand «aristocratiques».

      L'allemand est très peu parlé en dehors de l'Europe. Il est donc facile pour eux de normaliser régulièrement la langue.

      En revanche, l'espagnol est beaucoup parlé en dehors de l'Europe. Ce n'est pas l'Espagne qui dicte comment parler et écrire l'espagnol. L'orthographe y est particulièrement efficace et bien structurée. Cependant, les normes d'usage diffèrent tellement entre les pays hispanophones que cela devient difficile d'exporter un simple texte. Seulement pour leur «vouvoiement», une formule usuelle dans un pays devient bizarre ou même insultante dans un autre. On repassera pour l'«inclusivité».

      Pour le français, on peut à juste titre proposer des usages différents pour un corpus particuliers de mots (comme le fait Usito), mais le tronc commun entre tous les français est particulièrement important. Surtout, si la féminisation possible peut varier, l'orthographe du français est particulièrement standardisée. Le fait qu'il y ait si peu de variantes d'orthographe facilite les échanges entre les pays francophones. Ce n'est pas le cas de l'anglais.

      En effet, parce qu'elle est moins normalisée, l'orthographe anglaise est beaucoup plus variable selon l'origine (ex : «behaviour» en Angleterre, contre «behavior» aux États-Unis).

      De plus, pour montrer une maitrise de la langue en français, j'ose affirmer qu'on multiplie les syntaxes différentes, alors qu'en anglais, on ajoute du vocabulaire (1 000 000 mots répertoriés en anglais contre 50 000 en français!) Ce qui fait qu'en français, si la compréhension peut être un peu compliquée par une syntaxe complexe, elle reste possible sans dictionnaire. En anglais, la multiplication des mots fait que hausser le niveau de langage rend le sens totalement hermétique à un

    • Jean-Marie Francoeur - Inscrit 10 août 2013 16 h 08

      Le français de France s'est construit après 1789. Pour, eux, tout le reste ne vaut rien. Pour nous, ce sont nos racines. Comme peu d'entre eux étudient le français d'avant 1789, ils prennent plusieurs de nos mots comme des régionalismes ou pire, des anglicismes. Ce qui est paradoxal quand on voit la quantité d'anglicismes employés en France aujourd'hui, alors que nous nous efforçons de les éliminer. Losrqu'on les lit, je vois des anglicismes qu'on utisait dans les années '60 !

      De plus, L'Académie est très sélecte pour ne pas dire snob. Alain Rey disait avec justesse que dans la sphère oz l'on parle français, la frange est plus innovatrice que le noyau dur. Les Belges sont plus flexibles. Ils ont adopté "courriel et toile" qu'on dit encore en France "E-mail et Net" !

    • Gilles Théberge - Abonné 10 août 2013 22 h 13

      Dans le commentaire de monsieur Chiasson je note cette particularité pour ne pas dire cette singularité de la langue anglaise de multiplier les mots à l'infini.

      Je me souviens d'avoir lu il y a fort longtemps mais cela m'avait frappé et je l'ai retenu. Bref selon l'article en question portant sur la vie et mort des langues, la plus grande menace pour l'anglais lui-même, c'est la babélisation.

      Parce que justement la multiplication des mots ne constitue pas nécessairement un enrichissement du langage. Ça peut être un alourdissement.

      Et comme en plus la culture ambiante nourrit beaucoup le langage, on peut imaginer qu'à travers le monde, vu l'absence d'un organe régulateur comme c'est le cas en français, l'anglais peut prendre toutes sortes de directions et devenir incompréhensible en dehors de chaque zone spécifique à l'intérieur de laquelle il évolue.

      Un peu comme l'exemple de l'espagnol audemeurant que mentionne aussi monsieur Chiasson.

  • Jean-Marie Francoeur - Inscrit 10 août 2013 13 h 12

    Ajout

    Bluet, bleuet : Bluet signifiait aussi, dans le commencement du XVIIe siècle, un petit livre couvert de papier bleu, qui contenait le plus souvent des contes de fée et qui appartenait à la bibliothèque bleue ; de là la locution contes bleus. Littré

    • Gilles Théberge - Abonné 10 août 2013 22 h 18

      Brassens parle de bleuet dans une de ses chansons. Pourtant à son époque le bleuet typiquement québécois n'avait certainement pas franchi l'atlantique...De quoi parlait-il vraiment ?

      Quand même, écoutez-ça : http://www.youtube.com/watch?v=UzRk7Onedyo

    • Jean-Marie Francoeur - Inscrit 11 août 2013 13 h 08

      À M. Théberge :

      Il s'agit de la fleur "bleuet". Toute la chanson parle de fleurs. Les images ne montrent que des fleurs. Pas de doute possible.

      Belle chanson en passant. Merci M. Théberge

  • Monique Bisson - Abonné 10 août 2013 14 h 41

    Félicitations et merci!

    À toi, Hélène, la maître d'œuvre tenace et déterminée, et à toute l'équipe, tout aussi engagée, merci, de nous donner le Québec avec ses mots ancrés au cœur même de nos vies.

    Puisse ce dictionnaire québécois être connu et consulté aux quatre coins du Québec et de la planète parce que cette façon de décrire notre langue ne signifie aucunement un repli sur soi, mais plutôt un arrimage moderne à la Francophnie en communiquant avec celle-ci à partir de notions clairement définies, dans un dictionnaire de chez nous, qui respectent l'histoire, la géographie, la vie sociale, culturelle et politique du Québec. Longe vie à Usito, à ses artisanes et ses artisans!

    Monique Bisson, Gatineau