Vos données, au vu et au su de tous

Partager ses données, vous adhérez ou pas ? Face aux discours de principe parfois perçus comme moralisateurs, les avis sont partagés, notamment selon les disciplines.

— Le 1 septembre 2023

La science ouverte est-elle le camp du bien ? Le philosophe Camille Roelens fait un constat : « Les politiques de science ouverte se basent sur un discours vertuiste, présumant que les chercheurs auraient naturellement vocation à diffuser les connaissances, uniquement par amour de la science ou par dévouement… ». Ce chercheur à l’université de Lausanne et futur maître de conférences à l’université Claude Bernard Lyon 1 veut aller à contre-courant de ce qu’il estime être un jugement moral : « Est-il normal de vouloir partager ses résultats ? Ceux qui se préoccupent de leurs intérêts seraient-ils impurs ? ». Un questionnement qui l’a mené à publier un article en juillet 2023 : Esquisse d’éthique et d’une politique minimaliste de la science ouverte.

« Certaines recherches ne peuvent pas se faire sans une certaine opacité »

Camille Roelens

Trésor de guerre. Nicolas L.* chercheur à l’Inserm, suit de près le mouvement de l’open science : « Que tout le monde ait accès aux publis et qu’on remette en question la position dominante des éditeurs scientifiques sont de bonnes choses. » Mais en ce qui concerne l’open data, il est moins à l’aise : « En tant que chercheur, nous recevons de nombreuses injonctions à partager nos données. » Une pratique adaptée à certaines disciplines mais pas à la sienne : « Peut-être qu’en physique, les données sont considérées comme un produit de la recherche. Pour nous, épidémiologistes et biostatisticiens, c’est notre outil principal. » Collecter des données représente jusqu’à 80% de son temps et s’étale sur plusieurs années, voire des décennies. « On construit des questionnaires, on noue des liens avec des praticiens au contact des patients… », explique le chercheur.

Secret médical. Leurs données, comprenant des informations de santé ou génétiques, sont impossibles à anonymiser complètement. La réglementation française interdit donc à Nicolas L.* et ses collègues de les publier. C’est ce qu’ils répondent aux demandes de mise en accès libre des datas de revues comme celles de PLOS, au moment de la publication. En revanche, ils en donnent l’accès à la grande majorité des chercheurs qui les sollicitent… accès assorti d’un droit de regard sur leur réutilisation : « S’ils ont un vrai projet de recherche et un savoir-faire dans l’analyse, OK. Mais on ne veut pas qu’ils s’amusent avec et en sortent n’importe quoi. Nos données, c’est notre bébé… et c’est aussi la santé et la vie privée des participants. »

« Si on n’analyse plus, on se transforme en collecteur de données »

Nicolas L.*

Non nocere. Pour Camille Roelens, il s’agit avant tout d’une question d’éthique qui, comme toutes les questions d’éthique, « consiste à choisir la moins mauvaise solution, sachant qu’elles sont toutes mauvaises ». Pour y répondre, il a choisi de faire appel à l’éthique minimale, un concept développé par le philosophe du courant libertaire Ruwen Ogien, chercheur au CNRS décédé en 2017. « L’éthique minimale est basée sur le principe de non-nuisance. Elle critique d’autres types d’éthique – qu’Ogien appelle maximalistes – jugées trop prescriptives ». L’éthique minimale appliquée à la science ouverte reconnaîtrait les envies et intérêts des collègues dans leur pluralité : « Les chercheurs doivent y trouver leur compte. »

Mise en cause. D’après l’Unesco, la science ouverte porte des valeurs : qualité et intégrité, intérêt collectif, équité et justice, diversité et inclusion. Du point de vue d’une éthique minimale, l’équité, la justice, la diversité ou l’intégrité – dans le sens du respect des règles déontologiques – coulent de source. D’autres valeurs sont en revanche plus compliquées à défendre : « L’intérêt collectif est une fiction théorique, il n’existe pas en soi à la manière d’un bâtiment ou d’un arbre dont on pourrait prendre les mesures avec rigueur. Pourtant, beaucoup de personnes pensent en avoir une définition et défendent en réalité leur propre intérêt », explique Camille Roelens. En bref, selon lui, les valeurs de la science ouverte portées dans les discours officiels seraient entachées de “naïveté épistémologique” pouvant prendre un aspect moralisateur. 

« Nos données, c’est notre bébé… et c’est aussi la santé et la vie privée des participants. »

Nicolas L.*

Réticences. L’ouverture des données figure parmi les points de tension identifiés auprès de ses collègues d’autres disciplines : « Ceux qui collectent et structurent des données en apportant une véritable plus-value ont des craintes qu’il faut respecter », précise Camille Roelens. Notamment pour les sociologues ou anthropologues, la publication d’entretiens ou d’observations peut dégrader la relation de confiance avec les enquêtés, voire devenir un risque pour la sécurité du chercheur : « Certaines recherches ne peuvent pas se faire sans une certaine opacité ». Or, tous les chercheurs ne sont pas confrontés à ces problèmes: « Les disciplines diffèrent foncièrement. Le nier et juger d’emblée qu’un chercheur qui ne veut pas partager ses données est un fainéant ou un casse-pied, c’est ne pas respecter ses angoisses. »

Temps partiel. Ouvrir ses données est un travail en soi, encore plus chronophage pour des données sensibles comme celles de santé : « Pour partager des données avec nos collègues européens, les démarches prennent beaucoup de temps, notamment pour l’établissement du “Data Transfer Agreement” », explique Nicolas L.*. Avoir une documentation bien écrite est indispensable pour que d’autres puissent comprendre comment les données ont été collectées, triées… et ensuite les utiliser. L’hébergement et la sécurisation des données sont également des tâches lourdes. « On nous charge sans nous donner les moyens techniques ni le temps pour mettre en ligne nos données », déplore Nicolas L.* « Et si on n’analyse plus, on se transforme en collecteur de données. Cela pourrait s’envisager, on deviendrait alors une unité de service et non plus de recherche mais chacun doit être à l’aise avec ça », développe l’épidémiologiste qui, lui, tient à rester chercheur : « L’effort de collecte se nourrit de l’analyse des données. »

« Le premier bénéficiaire d’une donnée bien partagée est celui qui l’a produite »

Isabelle Blanc

Midi à vos portes. Même si toutes les conditions étaient réunies pour partager ses données, Nicolas L* tient aussi à protéger ses propres intérêts : « Si dès le premier article, je partage mes données, rien n’empêche d’autres chercheurs de me couper l’herbe sous le pied ». En mettant à disposition ses données, il donne en effet la possibilité à d’autres de réaliser les analyses qu’il comptait réaliser ultérieurement : « Que dirais-je à l’ANR ? Que je n’ai pas fait une partie du projet car quelqu’un d’autre l’a publié avant moi ? », s’interroge Nicolas L.* « Attention, il ne faut pas être naïf : ouvrir et partager ses données permet de conforter sa position de leadership quand on est dans une certaine dynamique. En-deçà d’un certain seuil de performance, cela peut nuire », analysait Patrick Cordier, un professeur en physique à l’Université de Lille pourtant attaché à la science ouverte, lors du Colloque du réseau des vice-présidentes et vice-présidents recherche et valorisation.

Pros and cons. Présente au même colloque ce mercredi 30 août 2023, Isabelle Blanc, administratrice ministérielle données, algorithmes et codes sources au ministère de l’Enseignement supérieur et de la Recherche a voulu rappeler le caractère incitatif de la science ouverte : « La loi pour une république numérique protège les chercheurs face aux éditeurs mais elle n’est pas contraignante : il s’agit de droit positif ». Elle reconnaissait également l’ampleur de la tâche : « Concevoir des données réutilisables par d’autres est un vrai travail scientifique », voire une « transformation des activités de recherche ». Mais l’ouverture des données n’est pas sans avantage pour les chercheurs : « Le premier bénéficiaire d’une donnée bien partagée est celui qui l’a produite ». Vos publications sont plus citées lorsque vous partagez vos données – entre 10 et 25% selon les études. Enfin : « Le partage de données est aujourd’hui reconnu comme production scientifique dans le cadre de l’évaluation des chercheurs », rappelle la spécialiste du ministère.

« Au lieu de culpabiliser les chercheurs, on peut essayer d’être plus exigeant dans les justifications »

 Camille Roelens

Restons calmes. Camille Roelens n’est évidemment pas opposé à la science ouverte mais souhaite qu’elle soit mieux justifiée. « Au lieu de culpabiliser les chercheurs, on peut essayer d’être plus exigeant dans les justifications [de la science ouverte, NDLR] en reproblématisant la question de l’utilité sociale de la recherche, par exemple. » Nicolas L.* s’interroge également sur les motivations de ceux qui poussent à l’open data : « Sur les réseaux sociaux, on observe des scientifiques qui cherchent à vérifier, traquer les erreurs… mais il y a des dérives et ça instaure une ambiance de soupçon généralisé. » Des vérifications pas toujours justifiées : « Un statisticien peut se croire meilleur qu’un épidémiologiste ou qu’un sociologue sauf que, selon les disciplines, on n’analyse pas des données de la même façon », explique Nicolas L.* 

Gare au Gafam. Dernière remarque : à plus grande échelle, ouvrir à tous les données collectées grâce à l’argent public bénéficie aux entreprises privées. « Si une agence comme Santé publique France demande nos données, ce serait tout à fait légitime. Mais pourquoi les partager avec des entreprises privées ? Même les Gafam [Google, Apple, Facebook, Amazon et Microsoft, NDLR] reviennent sur le partage de leurs données, estimant leurs intérêts menacés. » Durant un colloque en mai 2023, l’écologue Paul Leadley expliquait le bénéfice que tire les grandes entreprises en biotechnologies (pharmaceutique, cosmétique, agro-industrie) des bases de données de très grande taille centralisant les informations génétiques collectées par des milliers de chercheurs travaillant comme lui sur la biodiversité. Le secteur privé peut ainsi s’économiser des campagnes de collectes de données parfois coûteuses.

Des données partagées et bien vues

L’image de l’open data est plutôt positive dans le monde académique : 85% des chercheurs souhaiteraient partager leurs données et en réutiliser, montrait une étude de 2020. À travers le monde, les plus enclins à partager leurs données travaillent aux États-Unis, au Canada, en Australie, et en Nouvelle Zélande, les plus réticents en Afrique, au Moyen-Orient ou en Asie, observent ces mêmes chercheurs soulignant ainsi le rôle crucial des politiques et des financements gouvernementaux pour opérer les transitions individuelles.

* Le nom a été changé

À lire aussi dans TheMetaNews

Bienvenue au petit théâtre des auditions

Ce papier fait partie de notre série sur les concours comprenant notre poster agenda à télécharger et partager librement. Tic-tac… Les premières listes des sélectionnés pour les auditions vont commencer à tomber ! Côté chargé·e de recherche (CR), le CNRS ouvrira le...

Quand les chercheurs jouent les prolongations

Vous avez certainement un émérite dans votre entourage professionnel. Leur population n’a été toutefois que très peu étudiée. Une enquête de 2018, réalisée par le réseau des vice-présidents Recherche, dépendant de France Universités, auprès d'une quarantaine...

Femmes et maths : vers un amour réciproque ?

Image extraite du Théorème de Marguerite montrant une doctorante en mathématiques aux prises avec de nombreux défis personnels… et académiques – relire l'interview de la réalisatrice Anna Novion. Depuis vingt ans, c’est l’encéphalogramme plat : la proportion de femmes...