Lorsque l’on demande à ChatGPT, le chatbot d’OpenAI, quelles sont ses principales catégories d’utilisations, celui-ci génère une liste compilée à partir de diverses sources disponibles en ligne. Les résultats sont évidemment approximatifs, l’entreprise fondée par Sam Altman ne partageant pas publiquement ses données d’utilisation car celle-ci craint qu’elles ne soient utilisées par ses concurrents.
Afin de pallier ce manque d’informations, des chercheurs de l’Allen Institute for Artificial Intelligence ont lancé en 2023 le projet WildChat : une IA générative qui fournit un accès gratuit au modèle GPT-4 en échange du consentement donné par les utilisateurs quant à la collecte de leurs requêtes (anonymes) 1.
L’analyse de ce jeu de données regroupant des conversations d’un million d’utilisateurs dont dispose WildChat permet d’esquisser un portrait représentatif de l’utilisation des chatbots.
- Selon une étude du MIT publiée en juillet à partir des données Wildchat, les requêtes les plus courantes concernent de loin l’écriture par l’intelligence artificielle de récits fictifs ou bien la rédaction de suites à des récits existants 2.
- L’association de mots et d’idées est traditionnellement perçue par les chercheurs comme constituant la « meilleure » utilisation de l’IA car celle-ci n’exige pas de s’en tenir strictement à des faits 3.
- Viennent ensuite les requêtes à caractère sexuel (les utilisateurs demandant à l’IA de décrire des contenus sexuellement explicites ou de s’engager dans un « jeu de rôle »), la suggestion d’idées (brainstorming), l’aide à la résolution de problèmes, des questions d’ordre général…
- Les auteurs de l’étude notent que si les contenus liés à l’actualité sont les principales sources utilisées pour entraîner les modèles d’IA, les requêtes qui y sont liées représentent moins de 1 % du total des demandes formulées par les utilisateurs.
Il existe des similitudes entre l’intelligence artificielle générative, largement popularisée par OpenAI, et le lancement du moteur de recherche Google à la fin des années 1990. En 2006, la publication en ligne par la société de services internet AOL d’une liste de 20 millions de requêtes Google avait révélé que les utilisateurs avaient parfois tendance à divulguer inconsciemment des informations — parfois compromettants — sur eux à travers leurs recherches en raison du sentiment de désinhibition que procure le fait de pouvoir poser ouvertement des questions sur une interface numérique 4.
Seulement 5,4 % des entreprises américaines et 8,6 % des entreprises européennes déclarent utiliser l’intelligence artificielle dans leurs processus. Les données de Wildchat suggèrent que les utilisateurs préfèrent, du moins dans un cadre privé, se servir de l’IA principalement pour créer et les aider à s’organiser plutôt que dans un objectif de stricte création de valeur.
Sources
- ZHAO, Wenting, REN, Xiang, HESSEL, Jack, et al, « Wildchat : 1m chatGPT interaction logs in the wild », 2024.
- LONGPRE, Shayne, MAHARI, Robert, LEE, Ariel, et al, « Consent in crisis : The rapid decline of the ai data commons », 2024.
- Jeremy B. Merrill et Rachel Lerman, « What do people really ask chatbots ? It’s a lot of sex and homework. », The Washington Post, 4 août 2024.
- Michael Barbaro et Tom Zeller Jr., « A Face Is Exposed for AOL Searcher No. 4417749 », The New York Times, 9 août 2006.