Étienne Ollion : « Dire que les sciences sociales ont été “colonisées” est une pure vue de l’esprit »

Sociologue au CNRS et professeur à Polytechnique, Étienne Ollion a pressenti dès 2019 le potentiel de l’IA pour l’analyse de texte et l’a appliquée à un sujet brûlant : la place du genre en sciences sociales.

— Le 9 janvier 2026

Les sciences sociales sont régulièrement accusées d’avoir été envahies par les théories “wokes”. Est-ce pour cela que vous avez mené une étude sur le sujet ?

Nous n’avons pas mené l’enquête pour répondre à cette question, qui nous semblait mal posée. Mais à mesure que nous enquêtions, l’importance supposément prise par la “théorie du genre” dans les sciences sociales était dénoncée par certaines personnes ayant des objectifs politiques, avec un véritable écho dans les médias [on peut notamment citer l’Observatoire du décolonialisme et des idéologies identitaires ou bien le chercheur en langues et littératures médiévales Xavier-Laurent Salvador, NDLR]. A l’appui de leur thèse, ils compilaient des exemples ou interrogeaient maladroitement des bases de données – en produisant par exemple des décomptes sans les ramener au nombre total de productions scientifiques. De ce point de vue, notre étude apporte des éléments factuels en menant une étude systématique de l’intégralité de la littérature scientifique de sciences sociales françaises. 

« Le genre est vu comme un outil pour comprendre le monde social, au même titre que la classe ou la race »

Étienne Ollion

Qu’en est-il factuellement ? 

Nous ne voulions pas “mesurer le wokisme” – il est impossible de mesurer quelque chose qui n’est pas correctement défini – mais de manière plus modeste comptabiliser toutes les manières dont la notion de genre est abordée, des inégalités homme-femme jusqu’à l’évocation du patriarcat. Avec une définition volontairement extensive, notre résultat principal est que le recours au genre n’est pas généralisé en sciences sociales et n’a même pas beaucoup évolué sur notre période d’étude : il est passé de 9% en 2001 à moins de 12% en 2022 sur l’ensemble des 120 revues françaises analysées. Les chiffres varient grandement d’une discipline à l’autre : l’anthropologie ou l’histoire mobilisaient déjà beaucoup la perspective de genre depuis longtemps, la sociologie l’a investie largement, tout comme l’économie d’où elle partait pratiquement de zéro. Par conséquent, dire que les sciences sociales ont été “colonisées” par la perspective de genre est une pure vue de l’esprit. Ce n’est pas le cas même avec la définition extensive que nous avons choisie. 

Dans votre étude vous avez catégorisé à part les revues qui traitent de genre. Les études sur le sujet sont elles devenues une discipline à part entière ?

Des espaces se sont créés pour discuter spécifiquement des questions de genre : au sein de conférences, de revues, de masters, réunissant des chercheuses et chercheurs de disciplines différentes. Nous avons mis ces revues à part dans notre analyse, notamment pour déterminer leur part dans l’augmentation totale. La question du genre s’est diffusée en dehors des cercles spécialisés mais pas dans une énorme proportion. En France, les séparations restent d’abord disciplinaires : le genre est vu comme un outil pour comprendre le monde social, au même titre que la classe ou la race. La situation semble différente aux États-Unis, au moins dans la manière dont le domaine s’est institutionnalisé avec les gender studies mais je préfère renvoyer aux travaux des chercheuses spécialisées dans ce domaine, ce que je ne suis pas. 

« Lorsque Simone de Beauvoir écrit Le Deuxième Sexe, c’est déjà une perspective de genre, sans qu’elle soit nommée ainsi »

Étienne Ollion

Y a-t-il un effet générationnel ?

Très peu : nous avons mesuré l’évolution du genre dans les thèses et n’avons pas observé d’augmentation nette. Dans la littérature en général, en revanche, les femmes écrivent deux fois plus que les hommes sur le genre : environ deux tiers des articles mobilisant une perspective de genre ont été écrits par des femmes ou une majorité de femmes. La féminisation des sciences sociales – elles représentent aujourd’hui près de la moitié des universitaires et un peu moins des auteur·ices – explique en partie l’augmentation de la part du genre. 

Vous avez étudié la littérature scientifique depuis le début du 21e siècle. La notion de genre n’est-elle pas plus ancienne ?

En 1950, lorsque Simone de Beauvoir écrit Le Deuxième Sexe, c’est déjà une perspective de genre, sans qu’elle soit nommée ainsi. Le concept est arrivé plus tard pour faire la synthèse des études ayant commencé à apparaître. Mais, même aujourd’hui, les études adoptant une perspective de genre ne le nomment pas forcément. C’est pourquoi nous ne pouvions pas nous appuyer sur une analyse lexicale avec des mots-clés – de plus, une recherche du mot “genre” donne de faux positifs comme les “genres littéraires” – mais sur une analyse sémantique où c’est l’idée que l’on recherche. Jusqu’à peu, seuls des humains savaient le faire et cela limitait la taille des corpus étudiés. Aujourd’hui, les machines le peuvent également, ce qui constitue un vrai tournant pour nous.

« Nous avons aujourd’hui un logiciel qui fait aussi bien que des experts et permet d’analyser des corpus de 50 000 articles»

Étienne Ollion

Vous l’expliquiez lors d’une journée d’étude organisée par l’Urfist en novembre dernier : vous avez appris à la machine à identifier les perspectives de genre. Comment ?

Les modèles de langage existent depuis cent ans – le mathématicien Andrey Markov essayait déjà de prédire les prochains mots des ouvrages de Pouchkine dès 1913 – mais ne fonctionnaient pas bien. En 2017, l’arrivée des architectures dites transformers – c’est le T de GPT – a changé la donne. Dans notre cas, nous sommes partis d’un des premiers modèles publiés et toujours des plus performants – BERT pour les connaisseurs – et lui avons présenté des annotations que nous avions nous-même réalisées pour qu’il se forge une représentation de ce que nous recherchions. Avec seulement quelques centaines d’annotations, le modèle a pu répliquer notre travail de manière satisfaisante. À la place d’un échantillonnage et au lieu de faire appel, comme cela est souvent le cas dans notre domaine, à des armées de research assistants ou à des plateformes d’annotation en ligne payantes dont nous ne maîtrisons pas toujours la qualité, nous avons aujourd’hui un logiciel qui fait aussi bien que des experts et permet d’analyser des corpus de 50 000 articles grâce à seulement 500 à 1000 annotations réalisées par nos soins – ce qui représente deux après-midis de travail. Ce type d’analyse de texte ouvre des territoires entiers pour les sciences sociales… Pour moi, c’est un véritable saut quantitatif et qualitatif. 

Pourquoi ne pas avoir eu recours à l’IA générative, tant à la mode ?

Il y avait plusieurs raisons, dont le fait que nous ne savions pas comment elle allait annoter nos textes. La qualité ensuite : l’IA générative est souvent très efficace sur des problématiques classiques, moins sur des objets spécifiques, notamment ceux que travaillent les sciences sociales. Nous avons donc choisi un modèle non génératif et l’avons entraîné avec nos propres annotations issues de notre propre jugement, en instaurant notre propre définition du genre. Cela présente plusieurs avantages, en premier lieu celui de découvrir son corpus : nous avons annoté au plus 1% des textes, ce qui est peu mais permet de bien connaître ses données. Le recours à l’IA générative peut aussi poser des problèmes de réplicabilité : quand on passe de GPT4 à GPT5, les résultats ne sont plus les mêmes. Avec notre modèle, l’analyse peut être relancée autant qu’on le souhaite. Enfin, les données sont protégées car elles ne sont pas envoyées à une entreprise tierce et l’empreinte carbone est bien plus faible – l’équivalent d’un trajet en métro pour notre modèle. 

« Le facteur limitant pour (…) reproduire notre méthode est plutôt de savoir coder »

Étienne Ollion

Votre méthode ne demande donc pas de ressources de calcul importantes ?

Un ordinateur normal suffit. Si l’on veut vraiment gagner en rapidité sur de grands corpus, une petite carte graphique qui coûte environ 1000 euros le permet. Ce qui ne serait pas possible avec l’IA générative qui demande des ressources beaucoup plus grandes. Le facteur limitant pour les chercheurs et chercheuses en sciences sociales qui voudraient reproduire notre méthode est plutôt de savoir coder. Au sein de l’équipe, nous avons donc développé un logiciel doté d’une interface graphique pour annoter une partie d’un corpus et entraîner un modèle de manière guidée, avec des métriques indiquant si le modèle apprend bien ou non [un travail notamment réalisé par Émilien Schultz que nous avions interviewé sur un tout autre sujet, celui des postdocs, NDLR]. Aujourd’hui, une centaine de collègues testent la version beta, la première version définitive sortira début février 2026.

Observez-vous des réticences face à l’utilisation de l’IA en sciences sociales ?

Face à l’IA générative, oui, à cause du manque de contrôle de l’outil, du vol des données d’entraînement, de son bilan écologique, des conséquences sociales et économiques… Mais sur les modèles que nous avons utilisés, ces problématiques ne se posent pas vraiment. Et nos collègues se rendent aussi compte de leur intérêt pour la recherche, puisqu’ils permettent de produire des analyses beaucoup plus pointues. Une doctorante de l’équipe étudie par exemple de manière détaillée la façon dont une personne est citée dans la presse, ce qui serait impossible sans ces modèles. Nous allons également débuter l’analyse d’images en ajoutant sur le logiciel la possibilité de les annoter. 

« Dire que le genre vient en droite ligne des États-Unis est une généalogie tronquée qui sert d’épouvantail »

Étienne Ollion

Pour revenir à votre étude sur le genre, avez-vous l’impression d’avoir fait taire les critiques ?

Non car il ne s’agit pas de discussions scientifiques mais politiques. On a bien vu dans l’émission Complément d’enquête diffusée sur France 2 en novembre 2025 que la confrontation avec la réalité ne fait pas réviser leurs croyances aux promoteurs de ces thèses [voir la réaction de Xavier-Laurent Salvador, auteur de Face à l’obscurantisme woke suite à la présentation de l’étude, à la minute 49:00 de l’émission, ou celle de Jean-Michel Blanquer invité à la fin, NDLR]. En revanche, notre étude a plusieurs fois été présentée comme un contre-argument dans les médias, qui ont souligné son apport scientifique. 

En quoi la perspective de genre est un outil important pour les sciences sociales ? L’influence des États-Unis est-elle aussi importante qu’on l’entend dire parfois ?

Inégalités salariales ou, à l’inverse, d’espérance de vie, absence des femmes à certains postes… de nombreux mécanismes sociaux ne se comprennent qu’en adoptant une perspective de genre. Il serait donc regrettable de s’en passer. Notre étude montre par ailleurs une combinaison, plutôt qu’un remplacement, avec le recours aux notions de classe ou de race, qui reste également stable : la probabilité de faire appel à la classe si l’on étudie le genre est assez forte, notamment à cause de l’histoire marxiste du féminisme. Quant aux origines, nous étions huit personnes à contribuer à cette étude, dont des spécialistes du genre qui en parleraient mieux que moi, mais dire que le genre vient en droite ligne des États-Unis est une généalogie tronquée qui sert d’épouvantail. Les idées ont circulé entre les deux continents de manière beaucoup plus complexe que certains essaient de nous le faire croire. 

« Nous avons préféré ne pas rendre publics les résultats détaillés de nos analyses »

Étienne Ollion

Les sciences sociales sont encore plus fortement attaquées outre-Atlantique depuis un an. Cela impacte-t-il la France ?

Quand nous finissions l’article, j’étais à l’université de Columbia, qui était au cœur des attaques de Donald Trump avec la suppression des subventions fédérales pour des raisons  justement en lien avec le prétendu “wokisme” [relire notre interview de Peter Woit, NDLR]. C’était une mise en abyme vertigineuse… Des mots comme inclusion ou genre ont été du jour au lendemain interdits des projets et des publications, et évidemment pas qu’en sciences sociales. En intégrant la différence entre les sexes ou l’ethnicité, les sciences médicales étaient également visées car elles ne correspondaient pas à l’agenda de l’administration Trump. Dans ce contexte de tension forte d’un côté et de l’autre de l’Atlantique, nous avons préféré ne pas rendre publics les résultats détaillés de nos analyses (par revue, par auteur), malgré notre envie de partager ces données qui auraient certainement intéressées la communauté. Protéger les sciences et les scientifiques était plus important.

Crédit photo : J. Barande, École polytechnique

À lire aussi dans TheMetaNews