De quoi est capable GPT-4 ? | Le Grand Continent

Date: 16 mars 2023

Partager

Chat GPT est un agent conversationnel — ou chatbot — lancé par l’entreprise Open AI en novembre 2022. Ce bot repose sur un modèle de langage de grande taille pré-entraîné, ce qui signifie qu’il n’est à cette heure pas capable de donner des informations ou formuler des réponses en lien avec des événements qui se sont déroulés après 2021 (il n’a pas non plus accès à internet).

Mercredi 14 mars, OpenAI a annoncé le lancement d’une nouvelle version de ce modèle de langage : GPT-4, venue remplacer la version antérieure GPT-3.5.

Début février, seulement deux mois après son lancement, Chat GPT a atteint 100 millions d’utilisateurs, ce qui en fait la plateforme ayant connu la progression la plus rapide en termes d’utilisation.
Le succès de Chat GPT repose largement sur le modèle d’apprentissage utilisé pour GPT 3.5 et 4 : un « transformeur » (Transformer). Celui-ci est venu remplacer les précédents modèles utilisés jusqu’alors (RNN, ou recurrent neural network et LSTM, long short-term memory, notamment).
Reposant sur une architecture de réseau simplifiée basée sur des mécanismes dit « d’attention », le modèle d’apprentissage utilisé pour construire ChatGPT permet plus de « parallélisation » — ce qui signifie qu’il nécessite moins de temps d’apprentissage en permettant l’ajout de plus de puissance de calcul (GPU) ¹.

Ces avancées dans le champ de l’intelligence artificielle permettent au réseau neuronal d’apprentissage utilisé dans Chat GPT d’utiliser plus de paramètres, améliorant considérablement la fiabilité et la complexité des réponses apportées. S’il existe d’autres intelligences artificielles de nature similaire, celles-ci utilisent un nombre bien moins important de paramètres, d’où le succès fulgurant rencontré par Chat GPT.

Open IA n’a pas communiqué publiquement sur le nombre de paramètres utilisés par Chat GPT 4, mais certains tests permettent d’attester de l’amélioration significative de la nouvelle version par rapport à l’antérieure.

Selon le critère de référence MMLU (Massive Multitask Language Understanding), utilisé pour mesurer le degré de connaissances acquises dans 57 domaines différents (académiques comme professionnels : jurisprudence, biologie, histoire…) par un modèle d’apprentissage dans un temps imparti, GPT-4 est désormais de loin l’intelligence artificielle la plus performante.
Tandis que GPT-3.5 avait obtenu un score moyen de 70 au test après 5 essais, GPT-4 a obtenu un score de 86,4, le plaçant loin devant les autres modèles.
Selon OpenAI, les améliorations de GPT 4 par rapport à GPT 3.5 se font ressentir dans tous les tests auxquels les modèles d’apprentissage ont été soumis : raisonnement de bon sens sur des événements de la vie quotidienne, questions relatives aux pronoms à utiliser selon différents contextes, tâches de codage en langage de programmation Python ou bien des exercices de compréhension écrite ².

Le modèle GPT-4 serait capable de réussir plusieurs examens avec de meilleurs résultats que GPT 3.5 : l’examen du barreau, les tests d’admission en faculté de droit (LSAT), le concours national américain de biologie USABO ou bien des examens de sommellerie.

La principale évolution de GPT-4 par rapport à la version 3.5 réside dans l’analyse d’image ainsi que le traitement d’un plus grand nombre d’informations. Des applications comme Be My Eyes ou Duolingo ont également annoncé avoir intégré la dernière version de GPT dans leurs services afin de proposer un assistant virtuel capable de décrire en instantané et de manière précise des questions relatives à des images (à destination principalement des personnes aveugles et malvoyantes) et de répondre à des questions liées à celles-ci, ou bien de proposer l’accès à un « tuteur de langue personnel » ³.

We are thrilled to present Virtual Volunteer™, a digital visual assistant powered by @OpenAI’s GPT-4 language model. Virtual Volunteer will answer any question about an image and provide instantaneous visual assistance in real-time within the app. #Accessibility #Inclusion #CSUN pic.twitter.com/IxDCVfriGX
— Be My Eyes (@BeMyEyes) March 14, 2023

Les capacités des fonctionnalités déjà proposées par GPT-3.5 (traduction en différentes langues, écriture de code, résolution de problèmes complexes) ont quant à elles été améliorées, rendant l’agent conversationnel « plus créatif et collaboratif ».

Chat GPT, en dépit de cette mise à jour, est toutefois loin d’être sans faille, et commet encore de nombreuses erreurs d’interprétation (notamment en réponse à des questions pièges, lors de calculs simples ou bien lorsqu’il est question de physique élémentaire) ⁴.
Le président d’OpenAI, Greg Brockman, a déclaré à l’occasion du lancement de GPT-4 que Chat GPT fonctionnait mieux en tandem avec des humains plutôt qu’en autonomie ⁵.

Sources

Ashish Vaswani et. al., « Attention Is All You Need », Advances in neural information processing systems, 2017, vol. 30.
OpenAI, GPT-4 Technical Report, mars 2023.
Fil Twitter de Duolingo, 14 mars 2023.
Pour une compilation d’erreurs commises par ChatGPT et d’autres modèles de langage, voir : LLM failure archive (ChatGPT and beyond), giuven95, GitHub.
Deepa Seetharaman, « OpenAI Rolls Out New GPT-4 Version of Chatbot ChatGPT », The Wall Street Journal, 15 mars 2023.