GPT-5 es una familia de modelos con varias variantes que arbitran entre la eficiencia y el razonamiento para tareas complejas. Un enrutador ascendente tiene como objetivo dirigir cada solicitud a la variante más adecuada, o incluso encadenar varios modelos, optimizando el coste, la latencia y la calidad.

  • La innovación de GPT-5 no es tanto una ruptura tecnológica como una remodelación de los sistemas ya existentes. 
  • En este sentido, la elección de marketing —en particular el paso a la versión 5— no refleja el nivel de innovación que históricamente ha acompañado a estos lanzamientos. GPT-3.5 lanzó ChatGPT y permitió el uso a gran escala de los transformadores. GPT-1 introdujo los modelos de razonamiento y estableció una nueva dimensión en la transición de la escala de cálculo a la inferencia. GPT-4o desplazó la frontera de la innovación hacia la multimodalidad unificada en tiempo real (texto, visión y audio).
  • Por lo tanto, el lanzamiento de GPT-5 no debe interpretarse como el establecimiento de una nueva frontera en la escalabilidad del cálculo, sino como una reestructuración estratégica destinada a aumentar la utilidad, la eficacia y la adopción masiva en usos reales.
  • Los tokens de salida son 15 veces más baratos y se generan entre 2 y 4 veces más rápido que los de GPT-4.5 en su lanzamiento 1

El avance de GPT-5 no se encuentra en la escalada de la cantidad de computación.

  • A diferencia de las transiciones GPT-2 → GPT-3 → GPT-4, cada una de ellas marcada por un factor de 100 en términos de cálculo de preentrenamiento, GPT-5 no da un salto tan grande. GPT-5 mejora la eficiencia por tokens (es decir, es capaz de converger más rápidamente hacia una solución de nivel de rendimiento equivalente) en comparación con la generación anterior del modelo. En SWE-Bench Verified, un benchmark que mide la capacidad de un agente para resolver problemas de código, GPT-5 es aproximadamente tres veces más eficiente que o3 2.

El lanzamiento de GPT-5 pone así de relieve la trayectoria futura de la IA: la carrera hacia la inteligencia artificial general no puede ignorar las realidades económicas. 

  • GPT-5 ilustra cómo la IA sigue una curva de progreso tecnológico acorde con la lógica económica del despliegue de la inteligencia artificial a gran escala. El rendimiento bruto ya no es el objetivo inmediato de los laboratorios.
  • Más allá de la potencia de cálculo, los avances en IA se guían por un enfoque multifactorial, ya que los laboratorios también conceden importancia a otros factores, como la usabilidad (relación coste/rendimiento), la integración de herramientas (como Claude Code, Cursor o Deep Research) o la eficacia de la inferencia de los modelos.
  • El lanzamiento de GPT-5 pretende acentuar esta tendencia a la deflación y reforzar la competitividad de OpenAI mediante una doble estrategia: ofrecer una versión de código abierto de sus modelos y proporcionar una API un 90% más barata que la de sus competidores directos para los modelos propietarios.

El ritmo acelerado de publicación de modelos 3 reequilibra el panorama entre las innovaciones disruptivas y las iteraciones incrementales, mientras que la infraestructura de software y hardware necesaria para los próximos experimentos a gran escala obedece a una temporalidad diferente, condicionada por restricciones técnicas e industriales más pesadas.

GPT-5 también muestra que la industria no se encamina hacia un escenario de «el ganador se lo lleva todo», en el que un único modelo, omnisciente y suficientemente potente, dominaría todos los usos. El propio Sam Altman ha reconocido que «los usuarios discrepan sobre las fortalezas y debilidades de GPT-4o y GPT-5». Por lo tanto, la industria tiende más bien hacia un mercado competitivo en el que la diferenciación es posible en función de un número cada vez mayor de dimensiones: 

  • usos de alto riesgo/alto coste, que requieren una fiabilidad extrema, capacidades avanzadas de razonamiento y alineación, y una certificación sectorial;
  • usos para el gran público o diferentes usuarios que valoran diferentes aspectos de un modelo: la personalidad del modelo (estilo de redacción), su alineación con una política de moderación de contenidos o su huella cultural, la utilidad del agente al que alimenta, la coordinación de las diferentes herramientas en torno al modelo, son tan importantes como el rendimiento puro.

Ser el mejor de su categoría, es decir, ofrecer el mejor rendimiento por un coste determinado, es un objetivo clave para responder a la diversidad de usos: costes controlados para los laboratorios que despliegan su IA a gran escala, inferencia rápida para los usuarios, ejecución optimizada en un nodo de cálculo, un chip o incluso un teléfono móvil.

Este lanzamiento también ilustra cómo continúa y se amplía la crisis de la evaluación de la IA. 

  • Los benchmarks tradicionales sólo han medido una parte del rendimiento y la utilidad real de los modelos en la frontera tecnológica.
  • GPT-5 demuestra que las evaluaciones de los modelos ya no son buenos predictores del éxito o el fracaso del lanzamiento de un nuevo modelo y de su product-market fit: incluso con excelentes resultados en benchmarks cuantitativos clásicos, un modelo puede obtener una clasificación mucho más baja en métricas más complejas de sostenibilidad y preferencia.
  • Por ejemplo, Grok 4, que obtiene buenos resultados en varias pruebas estándar, sólo alcanza una posición intermedia en lmarena o yupp 4, y presenta un 80% de tiempo de horizonte inferior al de O3 y Claude Opus 4 en METR 5 (este último evalúa el tiempo que un modelo puede mantener un rendimiento fiable, definido aquí como un 80% de precisión en tareas largas y complejas en entornos de agentes).
  • Por el contrario, las ganancias aparentemente marginales en el rendimiento de Claude 4 en comparación con su predecesor Claude 3.7 en los benchmarks clásicos no reflejaban fielmente el salto cualitativo observado en el modelo que alimenta Claude Code: desde su lanzamiento en mayo, la base de usuarios activos de la plataforma se ha triplicado y su facturación anual se ha multiplicado por más de cinco 6.
Notas al pie
  1. GPT-4.5 se presentó entonces como el primer intento de OpenAI de crear GPT-5, que finalmente se lanzó con el nombre de 4.5, ya que se consideró insatisfactorio.
  2. Open IA,Introducing GPT-5, 7 de agosto de 2025.
  3. The pace of large-scale model releases is accelerating, Epoch AI, 19 de junio de 2024.
  4. Publicación en X, 11 de julio de 2025.
  5. Publicación en X, 31 de julio de 2025.
  6. Michael Nuñez, Claude Code revenue jumps 5.5x as Anthropic launches analytics dashboard, Venture Beat, 16 de julio de 2025.