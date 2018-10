Les banques d’ADN conçues pour la généalogie génétique connaissent actuellement un succès monstre qui contribue à accroître leur capacité à retrouver des parents plus ou moins éloignés, à tel point qu’elles sont de plus en plus utilisées par les corps policiers états-uniens pour élucider des affaires non résolues depuis des dizaines d’années. Au Québec, les enquêteurs n’ont pas encore eu recours à ces banques, mais cela ne saurait tarder. Dans un article paru dans la revue Science, des chercheurs montrent que ces banques permettent désormais d’identifier des individus à partir de leur ADN pourtant rendu anonyme, ce qui soulève des préoccupations en matière de respect de la vie privée. Ainsi, ils suggèrent l’adoption de mesures pour mieux protéger la confidentialité des données génétiques des individus conservées dans ces banques.

Aux États-Unis, les forces de l’ordre ont récemment réussi à établir l’identité du fameux Golden State Killer, qui avait commis douze meurtres et une cinquantaine de viols en Californie entre 1972 et 1986, en utilisant les banques de généalogie génétique ouvertes au public. Dans un premier temps, les enquêteurs ont séquencé le génome de ce tueur en série à partir d’échantillons d’ADN prélevés sur les scènes de ses crimes. Ils ont ensuite envoyé le profil génétique de cet individu à GEDmatch, où il a été comparé au million de génomes contenus dans la banque. Cette comparaison a permis de trouver un cousin du troisième degré du suspect. Puis, une recherche généalogique a abouti à l’identité du coupable — Joseph James DeAngelo, âgé de 72 ans —, qui a été confirmée par un test d’ADN au moment de son arrestation.

Entre avril et août 2018, au moins treize affaires ont été résolues aux États-Unis à l’aide de ces banques de généalogie génétique qui sont en voie de devenir un outil d’investigation incontournable. Le Laboratoire de science judiciaire et de médecine légale (LSJML) du Québec suit actuellement de près cette technologie qui, « à sa connaissance, n’a pas encore été utilisée au Québec ». « Certains aspects légaux doivent être étudiés avant que l’on puisse l’appliquer », nous a-t-on précisé.

Compte tenu de l’engouement du public pour la généalogie génétique, ces banques ne cessent de s’enrichir en données génétiques, et deviennent par conséquent de plus en plus efficaces pour établir l’identité d’individus à partir de leur ADN. Des chercheurs de la Columbia University, à New York, de la Hebrew University of Jerusalem et de la société MyHeritage ont évalué la puissance d’identification de la banque MyHeritage, qui possède le profil génétique de 1,28 million d’individus. Ils ont trouvé que 60 % des recherches ont abouti à l’identification d’un cousin du troisième degré ou même plus proche encore. Ils ont aussi effectué des recherches comparables dans la banque GEDmatch et ont obtenu des résultats similaires.

Dans un second temps, les chercheurs ont tenté de découvrir l’identité d’une femme ayant donné son ADN au projet international 1000 Genomes, qui visait à dresser une carte de la diversité génétique humaine. Comme la base de données de ce projet public est accessible à tous, les chercheurs ont pu télécharger le génome de cette femme — dont l’année de naissance était précisée —, qu’ils ont soumis à GEDmatch, qui a retracé deux parents éloignés et le couple d’ancêtres qu’elle partageait avec ces deux parents. L’ensemble de ces informations leur a permis de trouver le nom de cette femme.

En montrant qu’il est possible d’établir l’identité des participants à des projets de recherche, Yaniv Erlich et ses collègues insistent sur l’importance d’adopter des mesures pour mieux protéger les banques de données génétiques commerciales et publiques.

Cart@gène

Les personnes ayant participé au projet Cart@gène peuvent dormir tranquilles, leurs données génétiques (ADN) et cliniques n’étant accessibles qu’à des chercheurs qui ont obtenu une approbation écrite et dont le projet scientifique a fait l’objet d’une évaluation par les pairs. Seuls ces chercheurs reçoivent une clé leur permettant de décoder les données. Les autres chercheurs qui voudront utiliser les mêmes données par la suite recevront une autre clé pour y avoir accès, car les données auront été recodées. « Ce système offre la meilleure protection des données génomiques des participants qui soit. Il s’agit de la “pseudoanonymisation”, on code de telle façon qu’on pourra retrouver l’identité si besoin est pour une mise à jour, ou pour avertir la personne qu’elle est à risque d’une maladie qu’on pourrait éventuellement prévenir parce qu’on a enfin compris la signification d’un certain variant génétique qu’on croyait bénin, alors qu’il est pathogénique », précise la directrice du Centre de génomique et politiques de l’Université McGill, Bartha Maria Knoppers. « Il ne faut pas anonymiser les données au point où on ne pourra plus les réidentifier, car alors il ne sera plus possible de les mettre à jour, et surtout de relier les données génétiques aux données cliniques afin de développer une médecine de précision. »