¿De qué es capaz GPT-4? - El Grand Continent

Fecha: 16 de marzo de 2023

Compartir

Chat GPT es un agente conversacional -o chatbot– lanzado por la empresa Open AI en noviembre de 2022. Este bot se basa en un modelo de lenguaje preentrenado de gran tamaño, lo que significa que actualmente no es capaz de dar información o formular respuestas relacionadas con acontecimientos ocurridos después de 2021 (tampoco tiene acceso a internet).

El miércoles 14 de marzo, OpenAI anunció el lanzamiento de una nueva versión de este modelo lingüístico: GPT-4, que sustituye a la versión anterior GPT-3.5.

A principios de febrero, apenas dos meses después de su lanzamiento, Chat GPT alcanzó los 100 millones de usuarios, lo que la convierte en la plataforma de más rápido crecimiento en términos de uso.

El éxito de Chat GPT se debe en gran medida al modelo de aprendizaje utilizado para GPT 3.5 y 4: un «transformer«. Éste sustituyó a los anteriores modelos utilizados hasta entonces (RNN, o recurrent neural network y LSTM, long short-term memory, en particular).

Partiendo de una arquitectura de red simplificada basada en mecanismos de «atención», el modelo de aprendizaje utilizado para construir ChatGPT permite una mayor «paralelización», es decir, requiere menos tiempo de aprendizaje al permitir añadir más potencia de cálculo (GPU)¹.

Estos avances en el campo de la inteligencia artificial permiten a la red neuronal de aprendizaje utilizada en Chat GPT utilizar más parámetros, lo que mejora enormemente la fiabilidad y complejidad de las respuestas proporcionadas. Aunque existen otras inteligencias artificiales de naturaleza similar, utilizan muchos menos parámetros, razón por la que Chat GPT ha tenido tanto éxito.

Open AI no ha revelado públicamente el número de parámetros utilizados por Chat GPT 4, pero algunas pruebas demuestran que la nueva versión es significativamente mejor que la anterior.

Según el benchmark MMLU (Massive Multitask Language Understanding), utilizado para medir el grado de conocimiento adquirido en 57 campos diferentes (tanto académicos como profesionales: jurisprudencia, biología, historia…) por un modelo de aprendizaje en un tiempo determinado, GPT-4 es ahora, con diferencia, la inteligencia artificial con mejores resultados.

Mientras que GPT-3.5 obtuvo una puntuación media de 70 en la prueba tras 5 ensayos, GPT-4 obtuvo 86,4, lo que la sitúa muy por delante de los demás modelos.

Según OpenAI, las mejoras de GPT 4 en comparación con GPT 3.5 pueden apreciarse en todas las pruebas a las que se sometieron los modelos de aprendizaje: razonamiento de sentido común sobre sucesos cotidianos, preguntas sobre qué pronombres utilizar en diferentes contextos, tareas de codificación en el lenguaje de programación Python o ejercicios de comprensión lectora².

El modelo GPT-4 sería capaz de superar varios exámenes con mejores resultados que el GPT 3.5: el examen de acceso a la abogacía, el examen de admisión a la Facultad de Derecho (LSAT), el concurso nacional de biología USABO o los exámenes de sumillería.

La principal novedad de GPT-4 respecto a la versión 3.5 es el análisis de imágenes y el procesamiento de más información. Aplicaciones como Be My Eyes o Duolingo también han anunciado que han integrado la última versión de GPT en sus servicios para ofrecer un asistente virtual capaz de describir y responder de forma instantánea y precisa a preguntas relacionadas con imágenes (principalmente para personas ciegas o con problemas de visión), o para ofrecer acceso a un «tutor personal de idiomas»³.

We are thrilled to present Virtual Volunteer™, a digital visual assistant powered by @OpenAI’s GPT-4 language model. Virtual Volunteer will answer any question about an image and provide instantaneous visual assistance in real-time within the app. #Accessibility #Inclusion #CSUN pic.twitter.com/IxDCVfriGX
— Be My Eyes (@BeMyEyes) March 14, 2023

Se han mejorado las capacidades de las funciones que ya ofrecía GPT-3.5 (traducción a distintos idiomas, escritura de código, resolución de problemas complejos), haciendo que el agente conversacional sea «más creativo y colaborativo».

A pesar de esta actualización, Chat GPT dista mucho de ser impecable y sigue cometiendo muchos errores de interpretación (sobre todo al responder a preguntas capciosas, realizar cálculos sencillos o cuando se trata de física elemental)⁴.

El Presidente de OpenAI, Greg Brockman, declaró en la presentación de GPT-4 que Chat GPT funciona mejor en tándem con humanos que por sí solo⁵.

Notas al pie

Ashish Vaswani et. al., « Attention Is All You Need », Advances in neural information processing systems, 2017, vol. 30.
OpenAI, GPT-4 Technical Report, marzo de 2023.
Hilo Twitter de Duolingo, 14 de marzo de 2023.
Para una recopilación de errores cometidos por ChatGPT y otros modelos lingüísticos, véase : LLM failure archive (ChatGPT and beyond), giuven95, GitHub.
Deepa Seetharaman, « OpenAI Rolls Out New GPT-4 Version of Chatbot ChatGPT », The Wall Street Journal, 15 de marzo de 2023.