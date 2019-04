Des chercheurs de l’Université de Californie à San Francisco ont mis au point une prothèse permettant de redonner la parole à des personnes l’ayant perdue lors d’un accident cérébral vasculaire ou en raison de la maladie neurodégénérative dont elles sont atteintes. Cette prothèse permet de synthétiser ce que ces personnes désirent exprimer verbalement à partir des signaux électriques émis par les régions de leur cerveau impliquées dans la parole.

Actuellement, les personnes atteintes de graves paralysies les privant de la parole, comme le physicien Stephen Hawking qui souffrait d’une sclérose latérale amyotrophique, par exemple, font appel à un dispositif qui détecte les petits mouvements des yeux ou de la tête qu’elles arrivent encore à faire pour sélectionner chaque lettre composant les mots qu’elles veulent dire. Bien que ces dispositifs améliorent la qualité de vie des patients, ils traduisent leur pensée très lentement, générant tout au plus dix mots à la minute, alors que normalement nous émettons en moyenne 150 mots à la minute.

Dans le but de mettre au point une technologie capable de produire un discours plus fluide, les chercheurs se sont intéressés à l’activité du cerveau lorsque les personnes parlent. Ils ont alors découvert que les signaux émis par les centres de la parole situés dans le cortex ventral sensorimoteur constituaient en fait les instructions destinées aux différentes composantes du conduit vocal afin d’en coordonner les mouvements.

Dans leur plus récente étude qui fait l’objet d’une publication dans la dernière édition de Nature, les chercheurs ont fait lire à voix haute quelques centaines de phrases à cinq patients épileptiques, chez lesquels on avait implanté une série d’électrodes dans le cerveau afin d’en enregistrer l’activité dans le but de repérer la source de leurs convulsions. Certaines électrodes avaient été insérées au-dessus du cortex ventral sensorimoteur pour enregistrer l’activité de cette région pendant qu’elles lisaient.

Comme il a été impossible de traquer les mouvements de la langue, des lèvres et du larynx des patients en même temps que les signaux cérébraux, les chercheurs ont procédé à des enregistrements audio des volontaires lorsqu’ils lisaient. À l’aide d’un réseau de neurones artificiels, ayant la forme d’un algorithme d’apprentissage profond qu’ils avaient élaboré, ils ont ensuite pu déterminer tous les subtils mouvements articulatoires du conduit vocal qui devaient être effectués lors de l’élocution des phrases enregistrées dans la trame audio. Ils ont ainsi obtenu un conduit vocal virtuel qui peut être contrôlé par l’activité cérébrale — provenant du cortex ventral sensorimoteur — à l’aide d’un autre réseau de neurones artificiel (ou algorithme) capable de décoder les signaux cérébraux produits lorsque les personnes lisaient et de les transformer en mouvements du conduit vocal virtuel. Ensuite, un second réseau de neurones artificiel convertit ces mouvements articulatoires du conduit vocal virtuel en sons synthétiques qui sont générés par un synthétiseur.

La parole synthétique produite par ce système s’est avérée beaucoup plus compréhensible que celle obtenue par d’autres chercheurs ayant tenté de traduire directement les signaux cérébraux en discours synthétique sans passer par une simulation du conduit vocal de la personne.

Les chercheurs qui ont publié leur démarche et leurs résultats dans la revue Nature s’appliquent à raffiner leur technologie et espèrent même en arriver à reproduire la musicalité de la voix humaine, ce qui permettrait d’exprimer les émotions du locuteur.