Les données ouvertes se heurtent à des obstacles

Etienne Plamondon Emond Collaboration spéciale
Concilier l’accès aux données et la protection de la vie privée est difficile à mettre en œuvre.
Photo: iStock Concilier l’accès aux données et la protection de la vie privée est difficile à mettre en œuvre.

Ce texte fait partie du cahier spécial Science et culture

Les organisations se heurtent parfois à des obstacles dans la libération de données ouvertes, même lorsqu’elles affichent la volonté de les rendre publiques. Surmonter ceux-ci exigera, dans certains cas, un changement de culture.

Aux yeux de Paola Tubaro, les données ouvertes engendrent des répercussions positives sur le développement d’une économie locale. La chercheuse principale au Laboratoire de recherche en informatique de l’Université de Paris Sud observe la création d’entreprises et d’emplois grâce à de nouveaux services mis au point à l’aide de données brutes libérées par les municipalités à travers un site Web.

Dans le secteur de la santé, auquel ses travaux s’attardent depuis peu, elle prévoit aussi des retombées positives, notamment en ce qui concerne la diffusion d’informations sur les maladies rares ou sur les contagions. « L’ouverture, c’est bien, mais il faut qu’elle soit cohérente avec des enjeux de la vie privée », rappelle-t-elle néanmoins lors d’une entrevue accordée au Devoir par Skype.

Le 5 mai prochain, elle sera de passage à l’Université McGill pour participer à une table ronde sur les données ouvertes dans le cadre des Journées internationales de la culture scientifique. Parmi les sujets qu’elle abordera, il y a le risque que des informations personnelles confidentielles tombent entre les mains d’entreprises privées, plus particulièrement de compagnies d’assurances, qui les utiliseraient pour prévoir l’évolution de l’état de santé de patients, ainsi que les dépenses associées. Elle manifeste son inquiétude à cet égard alors qu’elle remarque un intérêt grandissant chez les entreprises pour les traces numériques laissées par les internautes sur les forums en ligne ayant un lien avec la santé.

« Dire en théorie qu’il faut concilier [les données ouvertes avec la] protection des données personnelles, c’est facile. Le faire en pratique, c’est un peu compliqué. Nous sommes encore en train de chercher la bonne solution », dit Mme Tubaro.

« Design informationnel »

Or c’est toute la culture d’une organisation qui doit parfois être revue pour répondre aux attentes en matière de données ouvertes, constate Daniel J. Caron, titulaire de la chaire de recherche en exploitation des ressources informationnelles. Le professeur de l’ENAP a baptisé « design informationnel » l’approche que devront, selon lui, adopter les organismes publics. Celle-ci consiste à réfléchir aux différents usages, à la fois internes et externes, dès le début de la création d’informations ou de la transformation de bases de données.

Il envisage même la conception de bases de données « bicéphales », dans lesquelles les informations personnelles apparaîtraient pour certains usagers, mais seraient absentes de la version accessible à tous les citoyens.

« On ne pense plus l’information simplement pour ses propres besoins et pour satisfaire nos obligations dans la prise de décisions; on doit la penser d’une façon beaucoup plus globale, et ce sera extrêmement exigeant », explique M. Caron. Cette approche nécessite un « changement de paradigme » dans les organismes publics, dont le rôle passe de celui de gestionnaire et de gardien de l’information à celui de diffuseur de l’information.

En mai 2016, M. Caron avait cosigné des études sur l’ouverture des données dans les municipalités et l’administration publique québécoises. Les conclusions considéraient comme un frein la manière de générer de l’information dans les administrations municipales sans penser au potentiel pour l’ensemble des citoyens. « Il faudrait qu’on fasse un effort comme on l’a fait en partie pour les ressources humaines et les ressources financières, juge M. Caron. C’est très difficile, parce que ce n’est pas une question de mauvaise foi […]. C’est dû en partie à la façon dont on a conçu nos organisations : elles ont été faites de manière hiérarchique. C’est difficile d’en sortir. »

M. Caron croit que les organismes publics devront, dès la création d’une nouvelle base de données, consulter, voire « se mettre en symbiose avec les utilisateurs potentiels ». « Cela pourrait être, dans certains cas, les chercheurs universitaires », évoque-t-il.

Les milieux de recherche : un frein ?

Si le milieu de la recherche peut profiter des données ouvertes, il peut parfois limiter la libération de certaines informations. Le consortium sur la climatologie régionale et l’adaptation aux changements climatiques Ouranos, qui est à la fois financé par les gouvernements et des universités de recherche, est actuellement dans cette situation. « Quand nous sommes l’intermédiaire pour aider un chercheur à aller collecter des données ou produire des résultats de recherches, nous n’avons pas nécessairement toujours les autorisations de diffuser publiquement les données brutes », souligne Nathalie Aerens, directrice du groupe d’appui à la programmation et à la direction d’Ouranos.

Le consortium a amorcé des discussions avec le gouvernement du Québec pour éventuellement diffuser des informations sur le portail Données Québec. Il devra, par contre, commencer par des données générées exclusivement à l’interne, soit des résultats de sondage dans le cadre d’évaluation de solutions d’adaptation aux changements climatiques. Pour les données issues d’une collaboration avec des chercheurs universitaires, la démarche se complique.

Après un coup de sonde dans la communauté scientifique, Mme Aerens a remarqué que la nouvelle génération de chercheurs semblait plus prompte à approuver la libération des données de recherche. En revanche, elle note que les établissements ou les institutions souhaitent s’assurer que les informations brutes, avant d’être rendues publiques, sont « bien exploitées d’abord et avant tout dans un certain nombre de belles publications qui auront épuisé le maximum du jus de ces données ».

Selon M. Caron, les organismes subventionnaires dans le domaine de la recherche pourraient un jour se doter de mécanismes pour exiger le partage des données brutes, afin que d’autres puissent les exploiter différemment après le dévoilement des premiers résultats. S’il reconnaît qu’un tel virage serait délicat à effectuer, il considère que « la question va assurément se poser, de la même façon qu’elle se pose pour les ministères. Ce sont peut-être de nouveaux modèles qu’il va falloir trouver ».