À l'université, l'IA générative gonfle les notes et fait vaciller les compétences

Dans cet article

Un signal venu d’une grande université texane
Trois usages très différents d’une même technologie
Le moment où l’outil prend la main
Sur le terrain, les facultés cherchent une parade
Un diplôme moins lisible pour les employeurs
Repenser ce que mesure une note

L’intelligence artificielle générative s’est installée dans les amphithéâtres sans qu’aucune circulaire n’ait jamais à le décréter. Des outils comme ChatGPT, Claude ou Gemini accompagnent désormais des millions d’étudiants pour rédiger des dissertations, déboguer du code, structurer des fiches de révision ou simplement reformuler une consigne mal comprise. L’effet sur les bulletins commence à se voir noir sur blanc, et il ressemble à une bonne nouvelle : les meilleures notes explosent dans les cours où ces assistants sont le plus utilisés.

Sauf que la mécanique a un revers difficile à ignorer. Quand un devoir maison rédigé en partie par une IA décroche un A, qu’apprend vraiment l’étudiant qui a appuyé sur la touche entrée ? Une étude publiée par un chercheur de l’université de Californie à Berkeley apporte les premiers chiffres solides sur cette question, et ils suggèrent qu’une inflation des notes se conjugue à une érosion silencieuse des compétences dans les disciplines où l’IA excelle. Le sujet déborde largement le cas américain, alors que trois ans de bouleversements de l’IA générative ont fait basculer la quasi-totalité des cursus d’enseignement supérieur.

À l’heure où les universités voient leurs moyennes grimper et leurs apprenants sortir avec un parchemin parfois plus brillant que leurs acquis, comment évaluer encore l’apprentissage réel sans renoncer aux outils qui en transforment les méthodes ?

Un signal venu d’une grande université texane

Le travail signé Igor Chirikov, chercheur au Center for Studies in Higher Education de Berkeley, a porté sur plus de 500 000 notes attribuées entre 2018 et 2025 dans 84 départements d’une même grande université publique du Texas. La méthodologie compare l’évolution des notes entre cours plus ou moins exposés à l’IA générative, selon que les évaluations se font à la maison ou sous surveillance.

Le résultat saute aux yeux. Dans les enseignements les plus exposés à ChatGPT, à savoir les cours de lettres, d’informatique ou de sciences humaines qui reposent largement sur des rendus écrits ou du code à rendre à la maison, la part des A a bondi de 13 points par rapport à 2022, année charnière où l’outil grand public d’OpenAI s’est installé sur les écrans étudiants. Cela représente environ 30 % d’augmentation relative, un chiffre qu’aucune réforme pédagogique n’avait jamais produit en si peu de temps.

Surtout, le décalage avec les cours moins exposés est net. Là où les évaluations passent par des examens en salle, sans accès à un ordinateur, la moyenne des notes reste à peu près stable, signe que la différence s’explique par le canal des devoirs non surveillés, ceux que l’IA peut entièrement produire à la place de l’apprenant.

Trois usages très différents d’une même technologie

L’étude ne traite pas la question en bloc : elle distingue trois manières dont un étudiant peut se servir d’une IA générative pendant son cursus, qui n’ont ni la même valeur pédagogique ni les mêmes conséquences sur la note finale :

l’assistance, lorsque l’IA aide à comprendre une consigne, à expliquer un concept ou à corriger une faute, sans rédiger à la place de l’étudiant ;
la création de tâches d’entraînement, lorsque l’IA invente des exercices supplémentaires, génère des QCM de révision ou propose des plans personnalisés ;
la substitution, lorsque l’IA produit directement le rendu attendu, dissertation, fragment de code ou exposé que l’étudiant remet tel quel ;
la zone grise du copier-réécrire, où l’apprenant régénère plusieurs sorties d’IA avant de les recoller à la main et de les déclarer siennes.

C’est la substitution, et plus encore cette dernière zone grise, qui inquiètent. Plus l’outil prend en charge l’effort de réflexion, plus la note récompense le savoir-faire d’un prompt et non la maîtrise du sujet. Ce glissement est précisément celui que les enseignants peinent à détecter à la simple lecture d’une copie, ce qui rend les évaluations classiques de plus en plus poreuses.

Le moment où l’outil prend la main

L’angle mort de l’IA à l’université n’est donc pas la triche au sens strict, c’est la dilution invisible des moments où l’étudiant fabrique ses compétences. Le chercheur Igor Chirikov le résume en quelques mots :

Si l’IA remplace les tâches qui construisent les compétences pendant l’apprentissage, les étudiants pourraient obtenir leur diplôme avec des capacités plus faibles précisément dans les domaines où l’IA est la plus forte.

Igor Chirikov, chercheur au Center for Studies in Higher Education de l’université de Californie à Berkeley, dans son étude publiée en mai 2026.

Le paradoxe est presque cruel. Plus une discipline gagne à automatiser ses tâches répétitives, plus elle expose ses étudiants au risque de ne jamais maîtriser ce que l’IA fait à leur place. Un futur juriste qui ne rédige plus une note de synthèse, un futur ingénieur qui ne débogue plus une seule fonction : la dépendance s’installe avant même la première fiche de paie, sans qu’on sache à quel niveau ces diplômés débuteront en poste.

Sur le terrain, les facultés cherchent une parade

Plusieurs universités américaines testent des contre-mesures jugées impensables il y a trois ans. Princeton, citadelle du code d’honneur depuis 1893, a voté le retour des examens surveillés en présentiel et tourné le dos à une tradition vieille de 133 ans qui faisait reposer l’évaluation sur la parole donnée. Le symbole est lourd : il acte que la confiance ne suffit plus quand un assistant invisible se tient à portée de clavier.

Harvard discute en parallèle un plafonnement strict des meilleures notes, avec pas plus de 20 % d’étudiants en A dans une promotion, quel que soit le niveau apparent des copies. D’autres établissements explorent l’oral d’argumentation, l’examen sur tableau, voire la dissertation manuscrite en temps limité, autant de formats où l’IA générative ne peut tout simplement pas intervenir. Le retour partiel du papier et du stylo n’est plus une lubie de professeur conservateur, mais une réponse pragmatique à un problème de mesure.

Un diplôme moins lisible pour les employeurs

L’enjeu déborde les murs des universités. Si les notes montent sans que les compétences suivent, le diplôme perd sa fonction principale, celle de signaler à un recruteur ce qu’un candidat est capable de faire. Selon une enquête britannique récente, 92 % des étudiants outre-Manche utilisaient une IA générative en 2025, contre 66 % un an plus tôt, ce qui suggère un basculement quasi total en l’espace de deux rentrées universitaires.

Le marché du travail commence à en tirer les conséquences. Dans plusieurs secteurs créatifs où l’IA générative pèse déjà sur l’emploi, les recruteurs vérifient autrement le niveau réel des candidats. Certains cabinets de conseil et grands groupes technologiques ajoutent désormais des épreuves de codage en direct, des exercices de raisonnement à l’oral ou des études de cas avec sources fournies. Le CV et la moyenne perdent du poids face à l’entretien technique, qui retrouve un rôle d’arbitre presque comparable à celui qu’il jouait avant l’arrivée des outils génératifs.

Même dans les écoles d’ingénieurs et les masters d’IA, où l’usage des outils est attendu, le critère se déplace : encore faut-il pouvoir déboguer les sorties et défendre un choix d’architecture sans béquille algorithmique.

Repenser ce que mesure une note

La question soulevée par l’étude de Berkeley dépasse de loin la simple statistique d’inflation. Elle interroge la nature même du contrat éducatif : évaluer un travail rendu ou évaluer une compétence acquise ne sont pas la même chose, et l’arrivée massive de l’IA générative met sous tension cette distinction restée longtemps confortable.

Les pistes qui se dessinent ressemblent à un retour aux fondamentaux, augmenté de quelques outils nouveaux : oraux, écrits en présentiel, projets co-construits avec un encadrant capable de suivre le raisonnement étape par étape, journaux de bord d’apprentissage qui rendent visible le cheminement et pas seulement le résultat. Aucune de ces pistes ne supprime l’IA, et toutes obligent à clarifier ce qu’une université promet réellement à un diplômé. La crédibilité du parchemin se rejouera dans cette zone fine, entre tolérance des outils et exigence sur le geste intellectuel qu’ils ne remplaceront jamais.

À l’université, l’IA générative gonfle les notes et fait vaciller les compétences