Gardez un oeil critique sur la tech

ArXiv capitule : l’IA générative dévore l’infrastructure qu’elle a parasitée

Submergé par un « déluge » d’articles de synthèse générés automatiquement, le site ArXiv qui a pris une place prépondérante dans la vie scientifique, durcit sa modération pour la catégorie informatique. Cette décision révèle l’épuisement des modérateurs bénévoles face aux « usines à papiers » algorithmiques, mais souligne aussi un paradoxe plus profond : les modèles de langage, nourris par des décennies d’« open access » scientifique, sabordent aujourd’hui les fondations mêmes de ce système ouvert.

CET ARTICLE EST GRATUIT ET ACCESSIBLE À TOUTES ET TOUS
Engagez-vous avec nous, faites un don défiscalisé et faites vivre un média indépendant !

Dans un post publié sur le blog d’ArXiv 1 relayé sur son compte X 2, Thomas G. Dietterich, modérateur d’ArXiv et ancien président de l’Association pour l’Avancement de l’Intelligence Artificielle sonne l’alarme : ces dernières années, ArXiv a été submergé de papiers scientifiques rédigés par IA générative. Pire, ces études, désignées sous le doux nom de « pré-print », n’apporteraient aucune avancée significative dans l’état des connaissances scientifiques.

Les centaines d’experts bénévoles — titulaires de doctorats dans leurs domaines — qui filtrent quotidiennement les soumissions d’ArXiv croulent donc désormais sous des vagues d’articles automatisés que Dietterich décrit comme « de simples bibliographies annotées ».

Pour éviter le burn-out collectif, depuis le 31 octobre, ArXiv exige donc qu’articles de synthèse et articles de position sur les sujets de science de l’informatique soient préalablement passés par une évaluation par les pairs d’une revue ou d’une conférence. En gros, les pré-print doivent être pré-approuvé pour accéder à la pré-publication. Un changement de pied assumé face à un phénomène qui dépasse les capacités humaines de tri et de revue. Les modérateurs reçoivent désormais « des centaines d’articles de synthèse chaque mois » — une multiplication exponentielle depuis l’émergence des grands modèles de langage qui rend « relativement facile de produire ce type de contenu à la demande ».

L’effondrement du modèle bénévole

Cette saturation révèle la fragilité d’une infrastructure académique qui repose sur le travail gratuit d’experts scientifiques. ArXiv, fondé en 1991 par Paul Ginsparg de l’université Cornell, s’appuie sur des modérateurs bénévoles approuvés par leurs comités disciplinaires. Le système fonctionnait lorsque les articles de synthèse demeuraient « rares et de haute qualité », rédigés par des chercheurs seniors établis, mais, depuis l’arrivée de l’IA générative, l’automatisation bouleverse cette économie du savoir.

Les « usines à papiers » IA peuvent désormais générer en masse des contenus superficiellement crédibles, saturant les canaux de validation humaine. Une étude de Nature Human Behaviour 3 révèle qu’en septembre 2024, près d’un quart des résumés en sciences de l’informatique portaient des traces de modification par modèles de langage — proportion qui continue de croître depuis le lancement de ChatGPT fin 2022.

Le piège de l’open access instrumentalisé

ArXiv, pilier historique de l’open science 4, a contribué à entraîner les mêmes algorithmes qui menacent aujourd’hui son existence. Ces modèles, nourris de décennies de recherche en libre accès, retournent maintenant cette connaissance sous forme de production automatisée qui contraint la plateforme à refermer ses critères d’admission.

Une décision qui va particulièrement affecter les jeunes chercheurs en renforçant de facto le pouvoir de filtrage des revues traditionnelles. ArXiv abandonne malgré elle sa mission de démocratisation de l’accès précoce à la recherche et renforce la position dominante des grandes publications pour lesquelles il faut payer parfois cher pour être publié.

Cette restriction, limitée pour l’instant à l’informatique, pourrait d’ailleurs s’étendre à d’autres disciplines si « des vagues similaires de soumissions générées par IA » émergent ailleurs. Entre l’explosion des slops scientifiques et la pression financière exercée par les publications scientifiques traditionnelles, les chercheurs se trouvent confrontés à un rapetissement de l’espace de publication ouvert, et c’est la science et le progrès de la connaissance humaine qui ralentit dans un même mouvement.


  1. Attention Authors : Updated Practice for Review Articles and Position Papers in arXiv CS Category, ArXiv, 31 octobre 2025 ↩︎
  2. https://x.com/tdietterich/status/1984279763964534836?s=20 ↩︎
  3. Quantifying large language model usage in scientific papers, Nature Human Behaviour, 4 aout 2025 ↩︎
  4. Qu’est-ce que la science ouverte ?, INSERM ↩︎

CET ARTICLE EST DISPONIBLE POUR TOUTES ET TOUS

Face à la domination des GAFAM et de leurs algorithmes opaques, nous vous aidons à reprendre la main sur les récits technologiques qui façonnent notre quotidien.

En soutenant Synth, vous co-construisez une voix forte, libre et indépendante.
Vous pouvez faire un don à partir de 1€

Contribuez dès aujourd’hui avec un don défiscalisé à 66 %.
Chaque euro compte, et un engagement mensuel multiplie l’impact.

Partager cet article
URL partageable
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *


Lire la suite
Inscrivez-vous à la newsletter
Gardez un oeil critique sur la tech !