Une IA résout un problème de maths vieux de 80 ans : ce que ça change pour la recherche

Dans cet article

Du coup de communication aux premières vraies preuves
Une chaîne de résolution à la portée de tous
Le problème 90, quatre-vingts ans de résistance
Des mathématiques surhumaines ? Pas vraiment
Une trajectoire qui défie l’entendement
Vers une recherche sans nous ?

Le 20 mai 2026, un modèle d’OpenAI a réfuté une conjecture mathématique restée ouverte pendant quatre-vingts ans. Pas une amélioration, pas une optimisation : une réfutation pleine et entière d’un problème célèbre de géométrie discrète, que des générations de chercheurs avaient tenté en vain de démontrer.

Pour situer l’enjeu, ce type de question fait partie des problèmes dits d’Erdős, du nom d’un mathématicien hongrois ultra-prolifique qui a semé derrière lui plus d’un millier d’énigmes, dont beaucoup résistent encore. Voir une machine en résoudre une, et pas des moindres, change la donne. Le médaillé Fields Timothy Gowers y voit la première résolution d’un problème mathématique majeur par une intelligence artificielle. Que s’est-il vraiment passé, et où mène cette trajectoire ?

Du coup de communication aux premières vraies preuves

L’histoire récente commence par un faux départ. En octobre 2025, un dirigeant d’OpenAI annonce que GPT-5 a résolu dix problèmes d’Erdős ouverts depuis des décennies. L’enthousiasme retombe en quelques heures : le modèle n’avait fait que retrouver, dans la littérature, des articles contenant déjà ces solutions. Le créateur du site de référence sur ces problèmes dénonce une présentation trompeuse, et le patron de DeepMind résume l’épisode d’un cinglant « this is embarrassing ».

Youtube video — Le parcours qui a mené à la première résolution d’un problème mathématique majeur par une IA.

La suite arrive vite. Dès novembre 2025, le système AlphaEvolve de DeepMind améliore plusieurs bornes ; surtout, en janvier 2026, trois problèmes d’Erdős tombent en une seule semaine grâce à des preuves originales générées par GPT-5.2 Pro. Ces preuves sont validées par Terence Tao en personne, autre médaillé Fields, ce qui ferme la porte au soupçon de coup marketing.

Plus frappant encore, ces résultats ne sortent pas d’un laboratoire. Un étudiant de 20 ans à Cambridge, puis un ingénieur amateur, obtiennent leurs preuves avec la version publique de ChatGPT à 200 $ par mois. La recherche de pointe se jouait soudain depuis un abonnement grand public.

Une chaîne de résolution à la portée de tous

Le plus déroutant tient à la simplicité du protocole employé. Là où l’on imaginait des systèmes secrets et spécialisés, la recette tient en quelques étapes accessibles à n’importe quel curieux motivé :

coller l’énoncé brut du problème dans ChatGPT Pro, sans guidage particulier ;
laisser le modèle raisonner puis produire une preuve en langage naturel ;
confier cette preuve à l’outil Aristotle, qui la traduit dans l’assistant Lean ;
laisser Lean vérifier la démonstration formellement, ligne à ligne ;
soumettre le résultat, souvent confirmé dans la foulée par un mathématicien de premier plan.

Le problème #728, réglé de cette façon le 6 janvier 2026, est considéré comme le premier problème d’Erdős résolu de manière autonome par une IA. Un ingénieur a même bouclé un autre problème en moins de 24 h, un week-end, presque par jeu.

Le mouvement s’est ensuite étendu sans moyens démesurés. Un test systématique de problèmes ouverts a livré, en vrac, trois solutions inédites validées, des résultats partiels et plusieurs preuves déjà connues. L’approche la plus naïve donnait déjà des fruits.

Le problème 90, quatre-vingts ans de résistance

Restait l’objection des puristes : ces problèmes seraient mineurs, ouverts faute d’intérêt. En avril 2026, le mathématicien Thomas Bloom publie justement un classement des dix problèmes d’Erdős qui comptent vraiment, ceux qui ont résisté à l’assaut des spécialistes. Un mois plus tard, l’un d’eux cédait.

Le problème en question, posé par Erdős dès 1946, porte sur les distances unitaires : comment placer un grand nombre de points dans le plan pour maximiser les paires séparées d’une même distance ? On croyait depuis longtemps qu’une grille régulière donnait le bon ordre de grandeur. Le modèle d’OpenAI a démontré le contraire, en mobilisant des outils de théorie algébrique des nombres que personne n’avait songé à appliquer ici.

Ceci, je pense, sera considéré rétrospectivement comme la première fois qu’une IA a résolu un problème mathématique majeur, défini comme un problème auquel tous les experts d’un sous-champ ont déjà réfléchi.
Timothy Gowers, mathématicien et médaillé Fields, à propos de la réfutation du problème d’Erdős sur les distances unitaires, 20 mai 2026.

Le résultat n’a rien d’anecdotique. Selon plusieurs relecteurs, dont le mathématicien Noga Alon, à peu près tous les spécialistes de géométrie combinatoire s’étaient un jour cassé les dents sur cette question. Sa résolution par une machine fait figure de jalon, salué jusque dans le camp des sceptiques.

Des mathématiques surhumaines ? Pas vraiment

Curieusement, la preuve n’a rien d’illisible : des humains l’ont rapidement validée, puis améliorée. Ce n’est donc pas le résultat qui était hors de portée, mais le chemin pour y parvenir. Il fallait une conjonction très improbable de conditions pour qu’un chercheur humain y arrive.

Thomas Bloom les détaille : consacrer beaucoup de temps à ce problème précis, choisir de le réfuter alors qu’Erdős le croyait vrai, juger utile de généraliser la construction d’origine, et maîtriser en plus une branche pointue dont on ignorait la pertinence. La compartimentation du savoir jouait contre les humains, car peu de chercheurs cumulent autant de spécialités au prix d’années d’apprentissage.

L’IA, elle, a coché toutes les cases. Sa force tient à une patience quasi infinie et un vaste éventail technique, qui lui permettent d’essayer mille pistes qu’un humain jugerait sans intérêt. C’est cette obstination méthodique qui lui a déjà permis, ailleurs, de venir à bout de chantiers techniques que des spécialistes traînaient depuis des années.

Une trajectoire qui défie l’entendement

Le plus vertigineux n’est pas le résultat isolé, mais la pente sur laquelle il s’inscrit. Début 2023, ChatGPT échouait encore sur des exercices de niveau collège. Trois ans et demi plus tard, un modèle réfute un problème ouvert depuis 1946.

Entre les deux, les jalons s’enchaînent à un rythme anormal : médaille d’or aux Olympiades internationales de mathématiques pour des modèles généralistes en 2025, premières preuves originales début 2026, puis ce problème majeur au printemps. Aucun signe de ralentissement n’apparaît, et DeepMind a publié une annonce comparable quelques jours après celle d’OpenAI.

Vers une recherche sans nous ?

La question qui affleure dépasse les seules mathématiques. On peut déjà confier un problème ouvert à une chaîne logicielle qui automatise tout, du raisonnement à la vérification formelle. Le rôle du chercheur humain pourrait se réduire à indiquer des directions, comme un directeur entouré de collaborateurs artificiels plus rapides et plus savants que lui.

Cette perspective trouble d’autant plus qu’elle touche une discipline-symbole de l’intelligence. Chaque mathématicien n’est pourtant déjà familier que de quelques fragments d’un édifice immense, et l’on dit que Poincaré fut le dernier à embrasser toutes les mathématiques de son temps. Déléguer la recherche à des modèles, comme nous déléguons déjà notre capacité à trier l’information, prolonge un mouvement déjà engagé.

Reste une inconnue de taille : ce qui arrive aux mathématiques guette les champs voisins, de l’informatique à la physique, et jusqu’à la recherche en IA elle-même. Une discipline capable d’accélérer sa propre amélioration ouvre un horizon que personne ne sait vraiment cartographier, et c’est sans doute là que se joue la prochaine bascule.