« De la data certifiée conforme »
Le laboratoire public Cascad pose les bases d’un certificat de reproductibilité pour les recherches. Christophe Perignon, son co-fondateur, nous explique pourquoi cela peut tout changer.
TMN. D’où vient cette idée de certifier les données de recherche ?
CP. En sciences économiques et sociales, on passe parfois quatre ou cinq ans sur un papier et une fois publié, il ne s’agit finalement que d’un pdf. Si les chercheurs sont sérieux dans la production de la connaissance, l’évaluation des papiers ne l’est pas autant car elle est basée sur le fait que ce pdf reflète exactement les résultats expérimentaux. Notre approche permet de remplacer cette méthode par un tiers de confiance qui “refait tourner le code” indépendamment, en particulier pour les données sensibles ou confidentielles.
TMN. S’agit-il de mettre en place une “Police des polices” pour la data en quelque sorte ?
CP. Notre approche n’a jamais été de dire que les chercheurs sont des menteurs ou des arnaqueurs mais d’aider ceux qui en ont envie. L’outil tel que nous l’avons développé depuis plusieurs années peut être utilisé par tous ceux qui utilisent des bases de données et des statistiques. Par ailleurs, Cascad propose de faire de la reproductibilité, la réplication est un autre processus, même si les deux sont liés.
TMN. Et si les données sont confidentielles, notamment dans le secteur médical ?
CP. Dans ce cas, le chercheur ne peut évidemment pas les partager avec nous. Le CASD [centre d’accès sécurisé aux données, NDLR] propose par exemple près de 280 bases de données à accès restreint et de grands nombres d’articles sont écrits grâce à ces données formidables… mais cela pose un problème de reproductibilité. Nous avons mis en place une collaboration avec cette structure pour disposer de la même machine virtuelle que le chercheur : toute sa démarche scientifique peut être reproduite. Nous délivrons ensuite un certificat en pdf et un “token” qui peut être transféré aux partenaires.
Propos recueillis par Laurent Simon
|