
Le nouveau grand modèle de langage d’OpenAI, o3, est beaucoup plus susceptible que ses concurrents de « saboter » son propre script.
Selon un test réalisé par les chercheurs de Palisade Research, celui-ci refuse de se laisser désactiver dans 79 cas sur 100, contre 3 pour le modèle d’Anthropic Claude 3.7 Sonnet, et 9 pour le modèle de Google Gemini 2.5 Pro.