1 — Evolution des modèles. 2025, année de l’essor des modèles de raisonnements soutenant la croissance des capacités agentiques de l’IA

    Fin 2024, le monde commençait tout juste à voir émerger les modèles de raisonnement. En 2025, nous sommes passés d’un monde où les modèles étaient essentiellement des prédicteurs autorégressifs produisant une réponse en une seule étape d’inférence à des modèles capables d’utiliser de manière systématique davantage de puissance de calcul à l’inférence, afin de raffiner itérativement la réponse et d’explorer différentes pistes de raisonnement, de mieux utiliser des outils. Concrètement,  cela a contribué à l’émergence d’une nouvelle génération d’applications agentiques telles que la recherche avancée (Deep Research), le développement interactif ou autonome de code (Claude Code), copilotes métiers etc. 

    • La part des tokens de raisonnement est ainsi passée de 0 % des tokens totaux utilisés fin 2024 — il n’y avait pas de modèles de raisonnement avant le 1er septembre 2024 — à 60 % en décembre 2025 1
    • Sur le célèbre benchmark de raisonnement ARC-AGI-1, GPT-5.2 est 390 fois plus efficace que le modèle o3 de décembre dernier 2. Sur GDPEval, un benchmark mesurant la performance des modèles sur des tâches importantes économiquement (code, administratif, legal etc.), les modèles de raisonnement surpassent les modèles traditionnels d’environ 20 % 3
    • Ces évolutions s’accompagnent de l’essor rapide des capacités agentiques des modèles : la durée maximale d’une tâche de code qu’un modèle peut mener à bien sans aide humaine, à seuil de fiabilité donnée (50 %, 80 % etc) double tous les 7 mois 4
    • Avec l’amélioration des capacités de raisonnement, de traitement de contextes longs, de suivi des instructions (et donc de l’intention de l’utilisateur) et d’utilisation d’outils (moteurs de recherche, navigation web, API de systèmes métiers, etc.), l’IA de 2025 passe progressivement d’une interface de chat classique à un agent actif au travail, capable de collaborer proactivement avec l’humain.
    • Les environnements vérifiables, mathématiques, code mais aussi certains domaines de la physique comme la matière condensée constituent un cadre particulièrement adapté pour l’apprentissage par renforcement appliqué durant la phase de post-training, en raison de la disponibilité de vérificateurs fiables de solutions ou de simulateurs à très haute fidélité. En mathématiques, plusieurs modèles ont obtenus une performance valant une médaille d’or aux Olympiades internationales en 2025 (Deepseek 5, Gemini Deep Think 6). 
    • Dans le même temps, le prix des tokens à l’inférence continue de chuter, alimentant  une adoption soutenue. À capacité de modèle équivalente, le prix des tokens générés chute drastiquement en quelques années. Le coût de GPT-4 est ainsi divisé par 1000 en en deux ans 7.

    2 — Adoption et usage. L’essor rapide des modèles chinois 

      Les laboratoires d’IA chinois ont émergé rapidement suivant l’exemple de DeepSeek en début d’année. 

      • Fin 2025, le fonds d’investissement a16z estime à 80 % la probabilité qu’une start-up de l’IA construise avec des modèles d’IA open source chinois, comme DeepSeek, Qwen (Alibaba) et Kimi (Moonshot AI). Selon les benchmarks, l’écart entre les modèles ouverts chinois et les modèles fermés américains varie entre 6 mois et 8 mois 8 mais parmi les modèles open source, les modèles chinois dominent en 2025 9
      • Airbnb admet privilégier Qwen à ChatGPT. 
      • La part de l’Asie dans la demande mondiale de tokens est aussi passée d’environ 13 % à 31 % en fin d’année reflétant une adoption accrue des entreprises de la région 10
      • Sous l’effet des contrôles américains à l’exportation, la Chine accélère son autonomisation dans les semi-conducteurs, réduisant sa dépendance à Nvidia et misant sur des puces nationales comme les Huawei Ascend 910B et 910C, désormais de plus en plus compétitives. Si les États-Unis ont approuvé le 8 décembre l’exportation des puces Nvidia d’intelligence artificielle H200 vers la Chine, Pékin a réagi en limitant l’accès des acheteurs nationaux à ces semiconducteurs.

      En 2025, environ 1,8 milliard de personnes ont utilisé l’IA dans le monde dont 550 à 600 millions quotidiennement 11. Mais une autre tendance forte qui se poursuivra au-delà de 2025  est à noter : l’IA d’entreprise représente désormais 6 % du marché mondial du SaaS. Depuis 2023, elle affiche une croissance plus rapide que n’importe quelle autre catégorie de logiciels 12.

      • Dans le même temps, à la frontière, la compétition est plus dense qu’en 2024, aucun modèle ne reste leader incontesté dans un domaine (code, legal, finance etc). Parmi les 10 modèles les plus à la frontière, aucun n’existait en février 2025. 
      • OpenAI est passé de 50 % du marché de l’IA d’entreprise en 2023 à 27 % 13 fin 2025. Les modèles open source représentent 30 % du marché. 

      3 — Investissements. 2025 confirme la suprématie américaine sur la puissance de calcul de l’IA

        Les États-Unis concentrent 75 % de la capacité de calcul mondiale : la puissance de calcul totale aux États-Unis est ainsi près de neuf fois supérieure à celle de la Chine et dix-sept fois supérieure à la capacité totale de l’Union européenne 14.

        • 82 % du capital risque de l’IA en 2025 a été levé par des entreprises américaines (109 milliards de dollars) contre 9 % pour l’Europe et le Royaume-Uni (12 milliards), et  4 % (5 milliards) pour la Chine 15.
        • Dans le même temps, les besoins énergétiques des principaux supercalculateurs dédiés à l’IA ont doublé chaque année (×2,0) entre 2019 et 2025. En 2025, le supercalculateur Colossus de xAI nécessitait une puissance énergétique d’environ 300 MW. À titre de comparaison, cela équivaut à la consommation d’environ 250 000 foyers américains.

        L’économie américaine est en même temps devenue dépendante des investissements dans l’IA.

        • Ainsi, au premier semestre 2025, 92 % de la croissance du PIB provient des dépenses d’investissement liées à l’IA. 
        • Cela dépasse la consommation des ménages américains comme facteur de croissance économique. 
        • Les investissements globaux en datacenter et logiciel représentent désormais environ 4 % du PIB américain 16.

        4 — Y a-t-il une bulle de l’IA ?

          Les débats autour de la bulle de l’IA se sont accentués autour du mois d’août et la publication d’un rapport par le projet NANDA du MIT qui suggérait à la fois des freins importants d’intégration de l’IA dans les processus des entreprises et l’essor du « shadow AI », économie parallèle de l’IA, dans laquelle les employés utilisent des outils d’IA même lorsque les initiatives officielles des entreprises stagnent.

          • Une étude de l’index économique d’Anthropic montrait début 2025 que seules environ 4 % des professions faisaient usage de l’IA pour au moins 75 % de leurs tâches 17. En 2025, l’intégration de l’IA reste principalement verticalisée par tâche, plutôt qu’une transformation globale du poste de travail.
          • Une étude de Stanford de septembre basée sur des données d’ADP du leader américain de service de paies montre que les travailleurs en début de carrière (âgés de 22 à 25 ans) occupant des emplois exposés à l’IA ont connu une baisse relative de l’emploi de 16 %, tandis que l’emploi des travailleurs plus expérimentés est resté stable 18.
          • Une étude d’Harvard conclut également que l’emploi des juniors recule dans les entreprises adoptant l’IA par rapport aux non-adoptantes, tandis que l’emploi des seniors reste largement inchangé en 2025. La baisse des juniors est concentrée dans les métiers les plus exposés à l’IA générative et s’explique par un ralentissement des embauches 19.
          • Le chiffre d’affaires annualisé d’OpenAI a atteint 13 milliards de dollars en août 2025, contre 5 milliards en début d’année, celui d’Anthropic est passé en 2025 de 1 milliard à 5 milliards en sept mois reflétant la commercialisation rapide et la diffusion accélérée de l’IA 20.
          • Une bulle pourrait-elle éclater en 2026 ? L’un des risques pourrait venir d’une hausse du coût de l’emprunt pourrait provoquer une correction des marchés et exposer l’IA au risque d’une bulle financière, à l’image de la bulle Internet qui a éclaté après des hausses de taux de la Fed.
          • Le rebond de l’inflation et la nomination du prochain président de la Réserve fédérale apparaissent ainsi comme des éléments clefs pour ce qui se passera avec l’IA l’année prochaine.
          Sources
          1. Malika Aubakirova, Alex Attalah, Chris Clark, Justin Summerville et Anjney Midha, « State of AI : An Empirical 100 Trillion Token Study with OpenRouter », décembre 2025.
          2. Simon Willison, « GPT 5.2 and useful patterns for building HTML tools », 12 décembre 2025.
          3. Nathan Benaich, State of AI Report 2025, Air Street Capital, 9 octobre 2025.
          4. Thomas Kwa, Ben West, Joel Becker et al., « Measuring AI Ability to Complete Long Tasks », METR, 19 mars 2025.
          5. Vincent Chow, « DeepSeek releases first open AI model with gold-level scores at maths olympiad », South China Morning Post, 29 novembre 2025.
          6. Thang Luong et Edward Lockhart, « Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad », Google DeepMind, 21 juillet 2025.
          7. Mert Demirer, Andrey Fradkin, Nadav Tadelis et Sida Peng, « The Emerging Market for Intelligence : Pricing, Supply, and Demand for LLMs », 12 décembre 2025.
          8. FrontierMath, Epoch AI
          9. The ATOM Project
          10. Malika Aubakirova, Alex Attalah, Chris Clark, Justin Summerville et Anjney Midha, « State of AI : An Empirical 100 Trillion Token Study with OpenRouter », décembre 2025.
          11. Shawn Carolan, Amy Wu Martin, C.C. Gong, Sam Borja, « 2025 : The State of Consumer AI », Menlo Ventures, 26 juin 2025.
          12. Tim Tully, Joff Redfern, Deedy Das, Derek Xiao, « 2025 : The State of Generative AI in the Enterprise », Menlo Ventures, 9 décembre 2025.
          13. Ibid.
          14. Konstantin F. Pilz, James Sanders, Robi Rahman et Lennart Heim, « Trends in AI Supercomputers », 22 avril 2025.
          15. Nathan Benaich, State of AI Report 2025, Air Street Capital, 9 octobre 2025.
          16. Jason Furman sur X, 27 septembre 2025.
          17. Kunal Handa, Alex Tamkin et al., « Which Economic Tasks are Performed with AI ? Evidence from Millions of Claude Conversations », 11 février 2025.
          18. Erik Brynjolfsson, Bharat Chandar et Ruyu Chen, « Canaries in the Coal Mine ? Six Facts about the Recent Employment Effects of Artificial Intelligence », 13 novembre 2025.
          19. Seyed Mahdi Hosseini Maasoum et Guy Lichtinger, « Generative AI as Seniority-Biased Technological Change : Evidence from U.S. Résumé and Job Posting Data », 31 août 2025.
          20. « Introducing the AI Companies Data Hub », Epoch AI, 30 septembre 2025.