Druide informatique - Après Antidote, un dictionnaire électronique de 800 000 cooccurrences

Éric Brunelle, président de Druide, est aussi le concepteur principal d’Antidote.
Photo: Éric Brunelle, président de Druide, est aussi le concepteur principal d’Antidote.

Druide informatique existe depuis 15 ans et ne cesse d'utiliser les ouvrages linguistiques déjà réalisés et les progrès technologiques en constante évolution pour lancer d'autres projets. L'entreprise garnit de la sorte son inventaire numérisé de nouveaux outils de soutien à la langue française. Il y a plus d'un an et demi, le Dictionnaire des cooccurrences ou des combinaisons voyait le jour.

Druide apporte sa contribution à la Semaine québécoise des dictionnaires. Éric Brunelle, son président, qui est aussi le concepteur principal d'Antidote, situe son entreprise par rapport à cet événement: «Depuis nos tout débuts, on s'applique sur un point, soit de mettre l'informatique au service de la langue française, en particulier dans la création de dictionnaires. On en compte maintenant dix dans notre répertoire actuel, qui s'appelle Antidote RX, et on en a même publié deux sous format papier aux Éditions Québec Amérique: ce sont les Dictionnaires des synonymes et des antonymes. On est des auteurs de dictionnaires et on est des lexicographes, bien que notre oeuvre la plus connue, qui est Antidote, existe sous forme informatique. Rien n'empêche que le style de sa lexicographie est tout à fait valable.» L'équation est la suivante: Druide égale dictionnaires électroniques et informatiques de la langue française.

Antidote, c'est plus qu'un correcteur, malgré les croyances de plusieurs: «Il en est un et il est très bon; les gens l'aiment bien, assure-t-il. Mais il y a aussi des dictionnaires à l'intérieur. Les personnes qui l'utilisent découvrent la puissance et l'intérêt de nos dictionnaires.»

Au tour des cooccurrences ou combinaisons

Druide, la compagnie mère d'Antidote, produit un ensemble d'outils linguistiques. Le rejeton des cooccurrences contribue maintenant à l'élargissement de la famille. Le président explique sa raison d'être: «C'est notre plus récent dictionnaire et on l'a sorti pour l'édition RX, soit en 2006; c'était une suite logique. On avait créé auparavant WEBELIXIR, un outil qui parcourt le Web pour détecter des erreurs à partir de la technologie d'Antidote. Après quoi, on s'est dit qu'on était peut-être capable de se servir de ce produit pour augmenter la puissance d'Antidote. On s'est dit qu'on pouvait l'utiliser pour aller siphonner d'immenses quantités de textes afin d'en tirer des éléments utiles, comme par exemple des régularités du français. De là est venue l'idée de créer un dictionnaire des cooccurrences.»

Mais qu'en est-il au juste de ces cooccurrences? «Il existe déjà un tel ouvrage au Québec publié par Jacques Beauchesne chez Guérin éditeur. Les Éditions Le Robert ont aussi sorti un livre du même genre qu'ils ont choisi de baptiser Dictionnaire des combinaisons. J'aime bien ce mot qui décrit bien de quoi il s'agit en l'occurrence: ce sont les différentes combinaisons possibles à partir d'un mot.» Il sert son exemple favori, qui porte sur le mot «passion». Il ressort de cette «passion», en consultant le dictionnaire électronique, qu'elle peut être combinée ou accompagnée de 172 épithètes: celle-ci peut être, entre autres, violente, vive, folle, dominante, voire même dévorante. «Ce sont les cinq exemples avec épithètes qui sont les plus fréquents qu'on a trouvés quand on a examiné notre corpus.»

Sans entrer dans une description exhaustive, les 469 cooccurrences de «passion» laissent encore voir quelles sont les utilisations possibles de ce mot, selon la fonction qu'il remplit dans un texte. Des phrases d'auteurs célèbres et respectés, qui contiennent le mot «passion», sont également citées à titre d'exemples. «On retrouve là l'ensemble des combinaisons les plus fréquentes à partir d'un mot. C'est là quelque chose que les langagiers et les gens qui font profession d'écrire aiment bien d'habitude quand ils cherchent l'expression exacte à utiliser. C'est beaucoup plus parlant que la simple définition d'un mot isolé», ajoute Éric Brunelle.

Il est complexe de s'attacher à une aussi vaste tâche que celle de relever l'ensemble des combinaisons les plus courantes avec un mot, comme il le rapporte: «C'est dur à constituer parce que c'est énorme et complexe. On a compilé 800 000 mots illustrés par un million d'exemples dans notre RX, et il va de soi que faire cela à la main aurait été très long. Par comparaison, dans le Robert, on retrouve environ 70 000 entrées. Heureusement, on a pu profiter des services de notre analyseur d'Antidote, qui a tout effectué le travail automatiquement.»

Bâtir sur les acquis

Druide entend perfectionner ce produit: «On est en train de travailler pour améliorer cet ouvrage en agrandissant le corpus de ce dernier, en ajoutant d'autres façons de visualiser l'information, etc.» Pour l'instant, il n'en demeure pas moins que le Dictionnaire des cooccurrences de Druide occupe la position de tête dans ce domaine. Il est le plus important en raison de son caractère électronique, comme il se plaît à le dire: «D'abord parce qu'il a fallu utiliser notre analyseur pour le réaliser. On s'est aussi servi de WEBELIXIR pour aller ramasser le corpus de 500 millions de mots; c'est une tâche qui ne se fait pas à la main. On avait déjà des outils en main et ont les a mis à profit. En bout de ligne, il fallait présenter le travail à l'utilisateur. Comment y arriver sans le support virtuel? Cela aurait pris plusieurs volumes alors qu'il n'y a aucun problème sur l'écran. L'électronique possède beaucoup d'avantages pour une pareille masse de données.»

Druide n'a de cesse d'ajouter des pierres à l'édifice déjà existant et le travail se poursuit. C'est le propre de l'entreprise que de porter plus loin la technologie linguistique en mettant à profit les produits déjà développés et en cours d'utilisation, tout en amenant celle-ci à la portée du plus grand nombre. Le président Brunelle en convient: «C'est là notre philosophie. On est au début de l'utilisation de la puissance de l'informatique au service de la langue. Nous, ce qu'on essaie de faire, c'est de pousser le plus loin qu'on peut. Notre entreprise n'a pas de frein; la technologie évolue sans cesse et nous nous targuons de la faire évoluer.»

Collaborateur du Devoir
3 commentaires
  • Pierre Dufresne - Abonné 29 mars 2008 07 h 31

    Un dictionnaire étymologique

    Quand Antidote fournira-t-il un dictionnaire étymologique? Ce serait d'un très grand intérêt et d'une utilité certaine pour approfondir la connaissance de la langue française et comprendre davantage le sens des mots. J'ai bien hâte qu'un tel dictionnaire soit intégré à Antidote, ce merveilleux instrument dont je me sers quotidiennement.

  • william morris - Inscrit 29 mars 2008 08 h 53

    Félicitations !

    Bonjour,
    Je ne peux que féliciter M. éric Brunelle et toutes les personnes qui trvaillent avec lui, pour l'admirable travail qu'ils font au service de la langue française, la plus belle qui soit.

    Longue vie à tous ces artisans de la défense et illustration de la langue française, ainsi qu'à leurs oeuvres !

    William Morris
    www.lemont.canalblog.com

  • Jean-Marc Pineau - Inscrit 30 mars 2008 11 h 26

    Félicitations à l'équipe de Druide !

    Le concepteur-rédacteur que je suis ne peut que recommander à tous ceux qui ont à coeur d'écrire sans faute l'utilisation du logiciel Antidote RX. Je remercie chaleureusement Éric Brunelle d'avoir conçu ce formidable outil d'aide à la rédaction.
    À titre de président de la Société québécoise de la rédaction professionnelle (SQRP), ainsi qu'en mon nom personnel, je voudrais offrir à Éric Brunelle, à Dolorès Tam et à toute l'équipe de Druide informatique nos plus sincères félicitations pour la création de tous ces outils, qu'ils soient sur support électronique ou papier.
    Si la langue est le principal véhicule du rédacteur, les ouvrages de Druide sont de précieux outils pour la maîtrise de cette langue que nous aimons et à laquelle nous voulons rendre tout le respect qui lui est dû.

    Jean-Marc Pineau, réd. a.
    www.sqrp.org