GPT-5 est une famille de modèles avec plusieurs variantes arbitrant entre efficacité et raisonnement pour les tâches complexes. Un routeur en amont a pour but d’orienter chaque requête vers la variante la plus adaptée — voire enchaîne plusieurs modèles — en optimisant coût, latence et qualité.

  • L’innovation de GPT-5 est moins une rupture technologique qu’une refonte de systèmes déjà existants. 
  • À cet égard, le choix marketing — notamment le passage à la version 5 — ne reflète pas le niveau d’innovation qui accompagnait historiquement ces lancements. GPT-3.5 a lancé ChatGPT et a permis une utilisation à grande échelle des transformers. GPT-1 a introduit les modèles de raisonnement et a établi une nouvelle dimension de passage à l’échelle du calcul à l’inférence. GPT-4o a déplacé la frontière de l’innovation vers la multimodalité temps réel unifiée (texte, vision et audio).
  • Ainsi, il faut lire le lancement de GPT-5, non pas comme l’établissement d’une nouvelle frontière dans le passage à l’échelle du calcul, mais comme une refonte stratégique visant à accroître l’utilité, l’efficacité et l’adoption de masse dans les usages réels. 
  • Les tokens de sortie sont 15 fois moins chers et générés environ 2 à 4 fois plus vite que ceux de GPT-4.5 à son lancement 1

La progression de GPT-5 se joue ailleurs que dans le passage à l’échelle de la quantité de calcul. 

  • Contrairement aux transitions GPT-2 → GPT-3 → GPT-4, chacune marquée par un facteur de 100 en termes de calcul de pré-entraînement, GPT-5 n’opère pas un tel saut. GPT-5 améliore l’efficacité par tokens (c’est-à-dire qu’il est capable de converger plus rapidement vers une solution de niveau de performance équivalent) par rapport à la génération précédente de modèle. Sur SWE-Bench Verified, un benchmark mesurant la capacité d’un agent à résoudre des problèmes de code, GPT-5 est environ trois fois plus efficace que o3 2

Le lancement de GPT-5 met ainsi surtout en lumière la trajectoire à venir de l’IA : la course vers l’intelligence artificielle générale ne peut ignorer les réalités économiques. 

  • GPT-5 illustre en effet comment l’IA suit une courbe de progression technologique conforme à la logique économique du déploiement de l’intelligence artificielle à grande échelle. La seule performance brute n’est plus l’objectif immédiat des laboratoires.
  • Au-delà de la puissance de calcul, les progrès de l’IA sont guidés par une approche multi-facteurs, alors que les laboratoires accordent également de l’importance à d’autres leviers, tels que l’utilisabilité (rapport coût/performance), l’intégration d’outils (comme Claude Code, Cursor ou Deep Research) ou l’efficacité de l’inférence des modèles.
  • Le lancement de GPT-5 vise à accentuer cette tendance à la déflation et à renforcer la compétitivité d’OpenAI grâce à une double stratégie : proposer une version open source de ses modèles et offrir une API environ 90 % moins chère que celle de ses concurrents directs pour les modèles propriétaires.

Le rythme accéléré de publications de modèles 3 rééquilibre le paysage entre les innovations de ruptures et les itérations incrémentales alors que l’infrastructure logicielle et matérielle nécessaire aux prochaines expérimentations à très grande échelle obéit à une temporalité différente conditionnée par des contraintes techniques et industrielles plus lourdes. 

GPT-5 montre également que l’industrie ne se dirige pas vers un scénario « winner takes all » dans lequel un modèle unique, omniscient et suffisamment performant dominerait tous les usages. Sam Altman a lui-même reconnu que « les utilisateurs divergent sur les forces et les faiblesses de GPT-4o et GPT-5 ». L’industrie tend donc plutôt vers un marché concurrentiel où la différenciation est possible selon un nombre croissant de dimensions : 

  • usages à haut risque / haut coût, qui demandent une fiabilité extrême, des capacités de raisonnement et d’alignement avancées et une certification sectorielle ;
  • usages grand public ou différents utilisateurs valorisent différents aspects d’un modèle : la personnalité du modèle (style d’écriture 4), son alignement sur une politique de modération de contenu ou son empreinte culturelle, l’utilité de l’agent qu’il alimente, l’orchestration des différents outils autour du modèle, comptent autant que la performance pure. 

Être le meilleur de sa catégorie — c’est-à-dire offrir les meilleures performances pour un coût donné — est un objectif clef pour répondre à la diversité des usages : coûts maîtrisés pour les laboratoires déployant leur IA à grande échelle, inférence rapide pour les utilisateurs, exécution optimisée sur un nœud de calcul, une puce ou même un téléphone portable.

Ce lancement illustre aussi comment la crise de l’évaluation de l’IA continue et s’amplifie. 

  • Les benchmarks traditionnels n’ont toujours mesuré qu’une partie de la performance et de l’utilité réelle des modèles à la frontière technologique.
  • GPT-5 montre que les évaluations des modèles ne sont plus de bons prédicteurs de l’échec ou du succès d’un lancement d’un nouveau modèle et de son product-market fit  : même avec d’excellents résultats sur des benchmarks quantitatifs classiques, un modèle peut se classer beaucoup plus bas sur des métriques plus complexes de durabilité et de préférence. 
  • Par exemple, Grok 4, qui surperforme sur plusieurs tests standards, n’arrive qu’en milieu de tableau sur lmarena ou yupp 5, et affiche un 80 %-time-horizon inférieur à celui d’O3 et de Claude Opus 4 sur METR 6 (ce dernier évalue le temps qu’un modèle peut maintenir une performance fiable, ici définie à 80 % de précision, sur des tâches longues et complexes, dans des environnements d’agents).
  • Au contraire, les gains en apparence marginaux de performances  de Claude 4 par rapport à son prédécesseur Claude 3.7 sur les benchmarks classiques ne représentaient pas fidèlement le saut qualitatif observé du modèle qui alimente Claude Code : depuis son lancement au mois de mai, la base d’utilisateurs actifs de la plateforme a triplé et son chiffre d’affaires annualisé a été multiplié par plus de cinq 7
Sources
  1. GPT-4.5 apparaissait alors comme la première tentative d’OpenAI de créer GPT-5, finalement lancé sous l’appellation 4.5, car jugé insatisfaisant.
  2. Open IA,Introducing GPT-5, 7 août 2025.
  3. The pace of large-scale model releases is accelerating, Epoch AI, 19 juin 2024.
  4. Par exemple, les utilisateurs ont remarqué que les modèles chinois ont un style d’écriture différent.
  5. Publication sur X, 11 juillet 2025.
  6. Publication sur X, 31 juillet 2025.
  7. Michael Nuñez, Claude Code revenue jumps 5.5x as Anthropic launches analytics dashboard, Venture Beat, 16 juillet 2025.