Technologie: Les débats entre Bush et Kerry analysés par un logiciel québécois

La campagne présidentielle de 2004 tire à sa fin et le résultat final de cette course connaîtra son dénouement demain. Au cours du dernier mois, les deux candidats que sont George Bush et John Kerry se sont affrontés à trois reprises lors de débats télévisés, chaque fois sur un thème différent.

Chacun des débats a donné lieu à des échanges musclés et, pour de nombreux analystes, il est fort probable que ces trois rendez-vous furent un des événements majeurs de cette campagne présidentielle.

Toutefois, bien que les analystes aient été nombreux à décréter Kerry gagnant par une courte tête, nul doute qu'il eut été intéressant d'avoir le lendemain dans les journaux une analyse plus exhaustive, et surtout plus objective, sur chacun des thèmes abordés par les candidats.

Lingua Technologies, une société fondée par Claude Coulombe, le père du défunt Correcteur 101, a mis au point une technologie logicielle de «forage textuel» (text mining) permettant d'analyser le contenu d'un texte par la détection automatique des thèmes présents.

Au lendemain de ces trois grands shows télévisés, les développeurs de cette jeune pousse ont décidé de passer à la moulinette les verbatim de chacun des débats et les résultats de ces analyses sont intéressants à plus d'un point de vue

Extractum

Selon Claude Coulombe, «l'analyse de débats politiques par ordinateur permet une plus grande objectivité car le logiciel se concentre uniquement sur les faits, sans partisanerie aucune. De plus, l'utilisation de l'ordinateur permet l'émergence de thèmes inattendus ou la confirmation d'une intuition».

Avec Extractum, la technologie mise au point par Lingua Technologies avec les chercheurs du Centre ATO de l'UQAM, une analyse pointue des propos tenus lors d'un débat peut débuter dès la minute que sa retranscription est disponible. Quant aux résultats, ils sont quasi immédiats.

Sans qu'aucun paramètre ou instruction ne soit introduit au préalable, l'analyse des trois débats Bush-Kerry par Extractum a permis de dégager quelques thématiques clés. Par exemple, l'examen des retranscriptions par Extractum confirme que le premier débat a été largement dominé par la guerre en Irak et que le troisième débat a davantage porté sur les thèmes économiques.

Un résultat prévisible? Peut-être, mais n'oublions pas que, contrairement aux téléspectateurs, l'ordinateur n'avait aucune idée des thèmes qui seraient abordés par les deux candidats.

À la suite de ce premier résultat, une analyse plus fine et plus subtile a révélé que Kerry a abordé une plus grande variété de thèmes que Bush qui, lui, s'est plutôt concentré sur la guerre en Irak et les baisses de taxes. Ce que les concepteurs d'Extractum appellent l'effet «cassette du politicien».

«De l'avis objectif et impartial d'Extractum, John Kerry s'est véritablement démarqué de George Bush quant aux enjeux de cette élection. Alors que Bush martelait constamment les mêmes propos, Kerry avait une vision beaucoup plus large et faisait preuve de plus d'ouverture.»

Et au Canada?

Quand on demande à Claude Coulombe pourquoi les débats des chefs lors de la dernière élection fédérale n'ont pas fait l'objet d'une analyse par Extractum, celui-ci répond que, contrairement aux États-Unis, les verbatim des débats des quatre chefs politiques canadiens n'étaient pas disponibles sur Internet. «Aux États-Unis, plusieurs sites offraient, quelques minutes à peine après la fin des débats, une retranscription complète de l'affrontement. Ici, rien.»

Bref, une analyse poussée de discours et de débats peut être réalisée en quelques minutes, en autant que l'on ait accès au verbatim. Car, selon le chercheur en linguistique informatique Pierre Plante et la linguiste Lucie Dumas, concepteurs de la technologie au coeur du produit commercialisé par Lingua Technologies, l'intérêt d'Extractum tient justement à son caractère entièrement automatique.

«À l'heure actuelle, l'analyse du contenu d'un groupe de discussion se fait à partir de l'annotation manuelle du texte. Un procédé souvent long et ardu. Extractum permet de faire le même travail en quelques minutes.»

Toutefois, il faire bien attention de ne pas interpréter aveuglément les résultats livrés par Extractum. Des nuances dans l'interprétation s'imposent. Pour Coulombe, un fait demeure: «Un analyste humain doit interpréter la masse de résultats forés par l'ordinateur pour leur donner plus de cohérence. Par exemple, il serait aventureux de prédire un gagnant à partir de conclusions fournies par Extractum. Reste à chacun la liberté d'exercer son jugement.»

À propos d'Extractum

Développé à Montréal, Extractum a été conçu pour analyser le contenu des groupes de discussion (focus groups). Extractum est un outil de forage textuel (ou text mining) permettant d'analyser le contenu d'un texte par la détection automatique des thèmes présents. Extractum est appelé à être utilisé principalement par les firmes de sondage et de recherche en marketing. De manière automatique, Extractum extrait les thèmes et offre à l'analyste les moyens de les agréger. Non seulement le logiciel n'oublie aucun thème, mais il est en mesure de faire des analyses plus profondes et ce, instantanément. Extractum traite les textes en anglais, bien sûr, mais selon ses concepteurs, il est encore plus puissant en langue française.

mdumais@ledevoir.com

À voir en vidéo