La part des sites Internet créés entièrement ou en partie par des outils d’intelligence artificielle a considérablement augmenté depuis le lancement de ChatGPT, le chatbot d’OpenAI, en novembre 2022. Selon une étude publiée en avril, 35 % des sites web publiés en mai 2023 étaient générés par l’IA 1.

  • Parmi l’ensemble des sites analysés dans le cadre de l’étude, plus d’un cinquième (21 %) ont été entièrement créés par l’intelligence artificielle.
  • En moins de trois ans, l’IA a pris une place centrale dans un domaine conçu par l’être humain au cours des quatre dernières décennies.

Le recours à l’IA dans la conception et la création de sites web pourrait avoir un impact direct sur l’exactitude factuelle des informations disponibles sur Internet, notamment via la génération d’images, et contribuer à l’appauvrissement de la diversité sémantique. 

  • L’étude montre en effet une corrélation directe entre la probabilité de recourir à l’IA et la diversité des termes, des structures et des points de vue utilisés.
  • Ainsi, les sites générés ou assistés par IA présentent une similarité sémantique supérieure de 33 % à celle des sites non IA, ce qui se traduit par une diminution de la variété des idées exprimées, une convergence des schémas d’écriture et, plus généralement, une homogénéisation des contenus présents sur le web.
  • La diminution de la diversité sémantique en ligne pourrait se répercuter sur les futurs modèles d’IA, qui sont en grande partie entraînés à partir de données web.

Les conséquences du recours massif à l’intelligence artificielle sur l’écosystème numérique s’ajoutent à un phénomène de dégradation numérique mesuré en 2024 par le Pew Research Center, qui observait la disparition de 38 % des pages web qui existaient une décennie auparavant.

  • L’utilisation croissante de l’IA pourrait contribuer à accélérer cette tendance.
  • Les chatbots sont en effet de plus en plus utilisés comme une alternative aux moteurs de recherche traditionnels. En conséquence, le trafic humain sur le reste d’internet diminue, tandis que le trafic non-humain augmente.
  • Pour s’adapter, les moteurs de recherche développent eux aussi des outils d’IA, comme l’option « AI Overviews » lancée par Google en 2024, qui permet de générer des réponses sans avoir à se rendre sur les sites.
  • Plus des deux-tiers (69 %) des recherches Google ne donnent désormais lieu à aucun clic de l’utilisateur, contre 56 % avant le lancement de la fonctionnalité.

La hausse du trafic de robots (ou « bots ») de scraping sur Internet a conduit la Fondation Wikimédia, l’ONG qui héberge l’encyclopédie en ligne, à mettre en place des mesures pour donner la priorité aux visiteurs humains. Au premier trimestre, jusqu’à 2 milliards de requêtes provenant de robots étaient bloquées chaque jour sur Wikipedia 2.

Sources
  1. Jonas Dolezal, Sawood Alam, Mark Graham et Maty Bohacek, The Impact of AI-Generated Text on the Internet, 14 avril 2026.
  2. Birgit Mueller, Chris Danis et Giuseppe Lavagetto, Quo Vadis, Crawlers ? Progress and what’s next on safeguarding our infrastructure, Wikimedia Foundation, 26 mars 2026.