Trafic web : les robots d'IA prennent le dessus et annoncent l'ère du web agentique

Dans cet article

Un basculement opéré en moins d’un an
Ce que ces robots font réellement
Un coût qui n’a rien de virtuel
Bloquer ou tout laisser passer, un faux dilemme
Le web agentique se profile déjà
Ce que cela change pour ceux qui font le web

Une part croissante de ce que vos statistiques présentent comme des « visiteurs » n’a plus rien d’humain. Derrière chaque page web se joue désormais une activité invisible : des robots d’exploration nourris par l’essor des intelligences artificielles parcourent les sites en continu pour en aspirer le contenu. Le trafic automatisé est devenu un sujet d’infrastructure, et plus seulement une affaire de référencement.

Le phénomène a changé de nature en quelques mois à peine, porté par des modèles de langage devenus incontournables dans nos usages quotidiens. Là où l’on interrogeait un moteur de recherche, on s’adresse aujourd’hui à un assistant qui a, lui aussi, besoin d’avaler des milliards de pages. Faut-il s’en réjouir, s’en inquiéter, et surtout, vers quoi cette mutation nous conduit-elle ?

Un basculement opéré en moins d’un an

Les chiffres récents donnent le vertige. D’après une analyse menée sur dix milliards de requêtes d’infrastructure, le trafic des robots liés à l’IA a bondi de 300 % en un an, au point de transformer la façon dont les sites sont explorés. Ce qui relevait du bruit de fond est devenu un évènement parfaitement mesurable.

Une autre donnée résume le basculement : début 2025, environ une visite web sur 200 était le fait d’un robot d’IA, contre une visite sur 31 à la fin de l’année. Sur le réseau Cloudflare, ces robots pesaient 4,2 % des requêtes HTML, une part qui grimpe à 8,5 % en ajoutant les moteurs classiques. Le seul GPTBot d’OpenAI a crû de 305 % entre mai 2024 et mai 2025.

Plus troublant encore, près de 80 % de cette exploration par l’IA sert uniquement à entraîner des modèles, sans renvoyer le moindre visiteur vers les sites concernés. Le contrat implicite du référencement, qui échangeait de la visibilité contre de l’audience, s’en trouve directement fragilisé.

Ce que ces robots font réellement

Contrairement à une intuition répandue, la plupart de ces robots n’attaquent pas les sites : ils s’y perdent. Conçus pour suivre chaque lien, ils confondent une même page avec ses innombrables variantes d’adresse. Une simple fiche produit peut générer six URL distinctes à leurs yeux, selon la couleur, la taille, le tri ou la pagination.

Ce comportement les entraîne vers des pages que personne n’aurait songé à indexer, et qui coûtent cher à servir. Les points d’entrée les plus sollicités sont rarement de simples articles :

les ajouts au panier et les tunnels de commande des boutiques en ligne ;
les pages de résultats filtrées par couleur, taille ou prix ;
les requêtes de recherche interne et les listes de souhaits ;
les interactions chargées dynamiquement, calendriers et vues paramétrées.

Ces adresses ne se mettent pas en cache aussi facilement qu’une page statique, et chacune réclame un vrai travail du serveur. Un robot enfermé dans une boucle peut alors marteler les mêmes points faibles pendant des jours, sans que personne ne s’en aperçoive.

Un coût qui n’a rien de virtuel

Pour mesurer l’ampleur du gaspillage, un seul robot a déclenché 3,75 millions de clics d’ajout au panier en vingt-quatre heures sur une même infrastructure. Cela revient à une requête toutes les 23 millisecondes, jour et nuit, chacune traitée comme une demande nouvelle plutôt que servie depuis le cache.

Au total, près de 7,67 millions de requêtes ont visé ces seules pages de panier en une journée, et une unique règle anti-boucle a filtré 550 millions de requêtes en un mois. Chaque appel mobilise un processus serveur, interroge la base de données et crée parfois une session, même pour un robot qui n’achètera jamais rien.

La plupart des comportements observés ne sont pas malveillants. Il s’agit de robots qui agissent de manière inefficace à grande échelle, et c’est là que les vrais problèmes commencent.
David Belson, ancien responsable de l’analyse des données chez Cloudflare, cité dans une étude sur le trafic des robots IA, 2026.

Le problème ne tient donc pas à la malveillance, mais à la répétition et au volume. L’exploration inefficace cesse d’être un sujet de trafic pour devenir un sujet de ressources, et donc de facture.

Bloquer ou tout laisser passer, un faux dilemme

Face à cette pression, la tentation du blocage total est forte. Elle serait pourtant contre-productive, car tous les robots ne se valent pas et certains restent vitaux pour la visibilité. Googlebot explore à lui seul 11,6 % des pages web uniques, loin devant les 3,6 % de GPTBot, et le couper reviendrait à disparaître des résultats de recherche.

La vraie question n’est plus de savoir s’il faut autoriser les robots, mais lesquels, sur quelles parties du site et à quelles conditions. Les grandes familles n’appellent pas le même traitement :

Type de robot	Exemples	Intérêt	Traitement conseillé
Moteurs de recherche	Googlebot, Bingbot	Visibilité et référencement	Autoriser, hors pages dynamiques
Robots d’entraînement IA	GPTBot, ClaudeBot	Notoriété indirecte, aucun renvoi	Encadrer selon les chemins
Robots non vérifiés	Aspirateurs inconnus	Faible, voire nul	Restreindre fortement

Aucune règle universelle ne tient : une boutique, un média ou un site vitrine n’ont ni les mêmes priorités ni les mêmes vulnérabilités. Le bon arbitrage dépend de ce que l’on protège, qu’il s’agisse de performance, de visibilité ou de maîtrise des coûts.

Le web agentique se profile déjà

Ce que l’on observe aujourd’hui n’est qu’une étape. Après les robots qui lisent le web pour entraîner des modèles arrivent ceux qui agissent à notre place. Le trafic généré par des agents autonomes apparaît déjà dans les données d’infrastructure, et Google a annoncé un identifiant dédié pour enregistrer les interactions de ses agents d’IA.

La trajectoire se dessine sans ambiguïté : demain, on ne parcourra plus une boutique en ligne pour comparer puis commander, on demandera à un assistant de le faire. Réserver un billet, remplir un panier ou suivre une livraison depuis un agent comme Gemini ou ChatGPT deviendra un geste banal. La frontière entre visiteur humain et automatisation continuera de s’effacer.

Ce mouvement n’a rien d’inédit dans l’histoire du web, qui a déjà vu le chiffrement des sites passer d’option payante à standard universel. Le web agentique emprunte la même pente, et les sites devront apprendre à dialoguer avec des machines mandatées autant qu’avec des personnes.

Ce que cela change pour ceux qui font le web

Quand l’automatisation gonfle artificiellement les visites, les compteurs perdent leur sens. Seuls les signaux corrélés gardent de la valeur : recherches de marque, trafic direct, qualité de l’engagement et revenus réellement liés à des humains. Le reste se dissout dans un brouillard statistique.

Déléguer notre navigation à des modèles, comme nous déléguons déjà notre capacité à trier l’information, ne se fera pas sans contrepartie. Les sites qui s’en sortiront ne seront pas ceux qui bloqueront le plus de robots, mais ceux dont les responsables auront cerné ce qu’ils veulent vraiment optimiser. La prochaine étape sera plus difficile à cartographier, et elle a déjà commencé.

Trafic web : les robots d’IA prennent le dessus et annoncent l’ère du web agentique