Guillaume Cabanac, détective sans impair

Armés de sacs poubelles et de pinces, certains arpentent les plages. Guillaume Cabanac, lui, passe au peigne fin la littérature scientifique pour la “dépolluer” de ses aberrations.

— Le 28 mars 2025

Quand on rencontre Guillaume Cabanac, on a l’impression de croiser un ancien camarade d’école : souriant, calme, avec sa petite chemise à carreaux (ou à fleur) et son accent toulousain chantant, rien ne laisse présager qu’on va parler de fraudes scientifiques pendant plusieurs heures – moult autres sujets seront d’ailleurs abordés mais restons concentrés. Cet enseignant-chercheur en informatique âgé de 43 ans est à son échelle une petite célébrité, s’étant fait reconnaître en repérant dans la littérature scientifique les tortured phrases, des expressions construites par copier-paraphraser-coller. Signes de plagiat, elles alertent sur le caractère souvent frauduleux des publications qui les contiennent. Un exemple ? L’utilisation de l’expression « counterfeit consciousness » au lieu de « artificial intelligence » – qu’on observe plus souvent que vous ne le croyez.

« Mon idéal était à l’université : enseigner et faire de la recherche. »

Guillaume Cabanac

Un pour tous. Ceci lui a valu, fin 2021, d’être nommé par la revue Nature comme l’un des dix scientifiques les plus influents de l’année – et a poussé les télévisions locales à débouler, caméra au point, dans son modeste bureau de l’IUT de Toulouse. Depuis, comme on assemble toutes les pièces d’un puzzle, Guillaume Cabanac a constitué un outil de détection presque exhaustif des comportements problématiques observés dans la littérature scientifique. Avec plus de 875 000 articles recensés en mars 2025, son Problematic Paper Screener l’a rendu incontournable pour toutes celles et ceux qui s’intéressent un tant soit peu au sujet. Un succès qu’il doit à sa curiosité et sa ténacité mais aussi à ses qualités humaines, qui lui ont permis de créer un environnement propice à ses recherches : « C’est avant tout un travail collectif », tient à préciser le chercheur. 

Tous pour un. « Guillaume Cabanac a un pouvoir d’attraction naturel », admet d’emblée Ophélie Fraisier-Vannier, actuellement postdoctorante dans son équipe, lui reconnaissant volontiers un talent certain pour s’entourer et bâtir des relations fortes. Avec « l’objectif que les gens se rencontrent et discutent », précise l’intéressé, Guillaume Cabanac a de fait créé en 2017 le Collège invisible : un collectif virtuel – via la plateforme Slack – dédié au départ aux questions de scientométrie puis de fraudes à la publication scientifique, qu’elles  proviennent de scientifiques peu honnêtes, manipulant par exemple les citations pour gonfler leur CV – nous vous en parlions – ou d’entreprises comme les paper mills qui refourguent des patchworks d’articles ou tout est « ni fait ni à faire ». Des comportements généralement signalés sur PubPeer ou sur les réseaux sociaux – X/Twitter auparavant, Bluesky aujourd’hui – où un grand nombre de contributeurs restent anonymes. À l’opposé, le Collège invisible, où l’on rentre sur invitation et où la plupart des éditeurs restent proscrits, est un sanctuaire pour les détectives, amateurs ou confirmés, qui peuvent ainsi s’organiser, coopérer, échanger des “tips”… 

« Quand j’ai vu Anna Abalkina pour la première fois, c’est comme si je rencontrais ma sœur. »

Guillaume Cabanac

Pairs et impairs. Certains des membres du Collège invisible sont pourtant bien connus : Elisabeth Bik, experte dans la détection d’images manipulées, Lonni Besançon, qui s’est lancé corps et âme dans la bataille contre Didier Raoult, Dorothy Bishop militant pour plus de transparence et de reproductibilité, notamment en psychologie, et dénonçant la présence d’Elon Musk dans les rangs de la Royal Society. Mais aussi Cyril Labbé qui s’intéresse à la génération automatique d’articles ou Anna Abalkina que nous avions interviewée au sujet des paper mills… Des relations fortes se sont tissées au fil des mois, même en visio. Des liens que Guillaume Cabanac et ses camarades détectives ont voulu renforcer lors d’une rencontre en personne en septembre 2024 : « Quand j’ai vu Anna pour la première fois, c’est comme si je rencontrais ma sœur », avouait-il lors d’une conférence. Tous partagent cette habitude presque addictive de scruter soir et weekend, comme d’autres “scrollent” sur les réseaux sociaux, les publications scientifiques à la recherche de fraudes. Avec une détermination sans faille à « dépolluer la littérature scientifique », Guillaume Cabanac incite à chaque intervention publique ses auditeurs à faire de même : signaler sur PubPeer afin que les éditeurs enquêtent, corrigent, voire rétractent les publications problématiques. Et cela fonctionne : la revue Journal of Intelligent & Fuzzy Systems vient de rétracter plus de 400 papiers suite à ses signalements.

Fins limiers. Les allégories utilisées pour décrire ces détectives uniques en leur genre ne sont pas toujours flatteuses. Au mieux, on imagine des Sherlock Holmes vêtus d’un imperméable beige, monocle à l’œil devant leur ordinateur. Au pire, leurs sobriquets anglo-saxon de sleuth ou watchdog évoquent des chiens reniflant la trace de malfaiteurs dans les recoins d’Internet. Ces scientifiques, qui se sont détournés de leur sujet premier de recherche pour se consacrer, partiellement ou non, à ces nouvelles questions, deviennent un véritable objet de curiosité, de fantasme… Voire même un objet de recherche pour certains chercheurs en sciences sociales qui les observent, analysent leurs pratiques et leurs discours. Ces derniers présentaient leurs premiers résultats lors de la conférence Métascience à Lyon en octobre 2024 – nous vous en parlions – soulignant la vision d’une littérature scientifique « pure et parfaite ». Quitte à passer pour des donneurs de leçons ? Guillaume Cabanac veut casser cette image : « Nous ne sommes pas les chevaliers blancs de la science. »

«  Je suis pour des technologies que tout le monde peut comprendre. » 

Guillaume Cabanac

Premier de sa classe. Venant d’un milieu modeste où peu avaient mis le pied au lycée mais où la curiosité intellectuelle était bien présente, Guillaume Cabanac est entré à l’université via une formation courte à l’IUT (institut universitaire de technologie) de Toulouse. Il aurait pu aller travailler chez Airbus, comme nombre de Toulousains, mais le secteur privé ne l’intéressait guère : « Mon idéal était à l’université : enseigner et faire de la recherche. » Un travail académique qu’il aborde avec une approche presque low tech, usant de méthodes des années 1970 ou 80 : « Je suis pour des technologies que tout le monde peut comprendre. » Sur l’IA, il alerte sur la difficulté à discerner les bonnes des mauvaises utilisations, sans jamais les condamner d’un bloc – nous vous en parlions. Après un doctorat à la frontière entre informatique et science de l’information – sur l’annotation des documents électroniques –, il est recruté maître de conférences à l’université Paul Sabatier Toulouse 3 en 2009, seulement six mois après sa soutenance. Dans un univers parallèle, il aurait fait un postdoc à l’étranger dans une université peut-être prestigieuse mais le destin et sa vie de couple en ont décidé autrement, lui offrant la chance de rester dans sa ville natale et de continuer ses recherches à l’Institut de Recherche en Informatique de Toulouse (IRIT), un énorme labo de 600 membres.

Bonne pêche. Guillaume Cabanac semble naviguer à contre-courant de ses collègues informaticiens. « Only dead fish go with the flow », peut-on lire dans les remerciements de son habilitation à diriger des recherches. Alors que la plupart, passionnés par les défis fondamentaux, considèrent que la recherche en computer science doit se faire pour elle-même, lui la perçoit comme un outil pour répondre à des questions plus larges : « Guillaume a une appétence d’ouverture à d’autres disciplines, comme la sociologie ou la psychologie… », explique son ex-doctorante Ophélie Fraisier-Vannier. C’est d’ailleurs cette vision de la recherche qui l’a poussée à poursuivre en doctorat. Une vision pas toujours bien comprise par des collègues dont certains ont pu lui souhaiter « bonne sieste » en le voyant partir assister à des séminaires de sociologie. Ceux délivrés par Yves Gingras (relisez son interview) l’ont particulièrement marqué. « Il y a cette peur de devenir l’ingénieur d’une autre discipline », analyse l’informaticien qui dirige aujourd’hui avec un collègue chimiste un projet sur la détection de médicaments sous-standard, embarquant Ophélie Fraisier-Vannier au passage. Touche à tout, ses sujets de prédilection restent d’un côté la recherche d’informations dans un corpus et de l’autre l’analyse quantitative de la science – la scientométrie – notamment via les publications ou les financements.

« Beaucoup ne prenaient pas le sujet au sérieux, j’ai tout de suite senti que Guillaume était intéressé »

Cyril Labbé

Affaires de pionnier. Son entrée dans le monde de la détection de la fraude, il la doit à Cyril Labbé. Professeur en informatique à l’Université de Grenoble-Alpes, il avait eu l’idée dès 2010 de créer un faux profil de chercheur, alimentant Google Scholar avec des publications générées automatiquement, pour montrer à quel point il était facile de manipuler le nombre de citations : de fait, le h-index du dénommé Ike Antkare avait rapidement grimpé à 94, soit plus que celui d’Albert Einstein. Admiratif, Guillaume Cabanac avait provoqué la rencontre lors d’une conférence en 2016 : « Alors que beaucoup ne prenaient pas le sujet au sérieux, j’ai tout de suite senti que Guillaume était intéressé », se souvient Cyril Labbé. Leur relation de travail et d’amitié naissante se scelle durant la Covid et les confinements. Échangeant régulièrement par visio, les deux enseignants-chercheurs développent un outil pour détecter ces fausses publications générées par un ancêtre de l’IA générative nommé SciGen – nous les avions interviewés tous les deux à ce sujet. « Travailler avec Guillaume a apporté beaucoup de sens à ce que je faisais », confie Cyril Labbé.

All in. Mais le Toulousain voit plus loin : comment scanner la littérature scientifique dans son intégralité ? D’autant plus que les fichiers PDF sont difficiles à traiter : « Nous avions besoin de textes bruts », explique-t-il. Il demande alors à l’entreprise Digital Science l’accès à sa base de données Dimensions, concurrent des très fermés Web of Science (Clarivate) ou Scopus (Elsevier) – nous vous en parlions –, indexant quelque 150 millions de publications avec un modèle freemium : une partie seulement est gratuite. Alors que Digital Science vend ses services aux établissements de recherche à des fins d’évaluation, elle met gratuitement à disposition son équipe d’ingénieurs pour accompagner Guillaume Cabanac et ses collègues : « Sans cette symbiose, le PPS [Problematic Paper Screener, NDLR] n’existerait pas », affirme le chercheur qui s’interroge toutefois sur les biais que peuvent introduire ce genre de partenariat. Digital Science n’est cependant pas une maison d’édition et Guillaume Cabanac souhaite de toutes façons embarquer tous ceux qui visent comme lui la dépollution de la science. En veut pour preuve la présence en décembre dernier au symposium Forensic Scientometrics de la responsable à l’intégrité scientifique de la maison Sage Adya Misra, appréciée du collectif pour sa démarche volontaire et transparente. 

« Guillaume considère ses doctorants comme des collaborateurs, sans relation ascendante »

Ophélie Fraisier-Vannier

Pas top down. Depuis son laboratoire toulousain, Guillaume Cabanac s’est taillé une légitimité à l’international et ce malgré un CV atypique, puisqu’il ne publie pas majoritairement dans les revues de sa discipline – mais dans d’autres tout aussi honorables. À 39 ans, il décroche un poste de professeur des universités, toujours à Toulouse, ainsi qu’un prestigieux financement de l’European Research Council (ERC) sur la correction de la science avec Cyril Labbé – le projet NanoBubbles qui rassemble également le physicien Raphaël Lévy ou la chercheuse Frédérique Bordignon. Mais il garde la tête froide : « Si demain je n’ai plus de moyens, je pourrai continuer à faire de la recherche. » Car l’informaticien met un point d’honneur à toujours développer ses propres programmes, réaliser la maintenance lui-même, les mains dans le cambouis. Il rejette le modèle du professeur qui met sa ribambelle de doctorants sous pression pour obtenir une promotion. « Guillaume considère ses doctorants comme des collaborateurs, sans relation ascendante », témoigne Ophélie Fraisier-Vannier.

Tout passe, tout lasse ? Et si cet engouement pour l’intégrité scientifique n’était qu’un effet de mode ? Membre de l’IUF (Institut universitaire de France) et bénéficiant en conséquence d’un nombre d’heures d’enseignement réduit, Guillaume Cabanac,  « en contrepartie », donne régulièrement des exposés de vulgarisation, sortes de liste à la Prévert de toutes les fraudes à la publication que lui et ses camarades ont observé – en voici un exemple. « Ceux qui connaissent le sujet en ont marre, ceux qui n’en sont pas familiers le trouvent anxiogène », observe-t-il. Un peu comme le changement climatique, somme toute. Mais il n’abandonne pas les actions de sensibilisation et autres ateliers PubPeer : « Chacun doit se méfier, en premier lieu en tant qu’auteur. » Car certains d’entre eux ne réalisent pas toujours le caractère plus que limite de pratiques comme le fait d’ajouter parmi les auteurs d’un papier un collègue qui n’y a pas contribué – pour lui faire plaisir ou pour bénéficier d’une réduction sur des frais de publication. Mais plutôt que d’incriminer les individus, il préfère s’en prendre aux gros éditeurs, qu’il “tag” sur PubPeer ou sur Bluesky, les mettant au pied du mur. Faut-il se contenter de racler les égouts de la science et de montrer ce qui en sort ? s’interroge Guillaume Cabanac avec ses camarades de NanoBubbles. « On peut trouver un autre moyen de présenter l’intégrité scientifique, à travers une science qui fait rêver », estime-t-il. Et si, comme la lutte contre le changement climatique, l’intégrité scientifique était aussi une bataille des imaginaires ?

À lire aussi dans TheMetaNews