En partenariat avec l’Institut Français, le Grand Continent publie une série de textes et d’entretiens : ces « Grands Dialogues » forment un dispositif réunissant des personnalités intellectuelles de premier plan venues du monde des arts, des lettres, des sciences, du journalisme et de l’engagement et représentant l’ensemble des États membres de l’Union européenne.
On entend souvent que nous serions en train de vivre une ère d’incertitude alors que, dans le même temps, nous avons accès à de plus en plus d’informations pour analyser et améliorer nos prises de décisions. Deux exemples d’événements récents et prévisibles nous ont surpris lorsqu’ils se sont produits, l’épidémie de Covid-19 et la guerre en Ukraine. Comment expliquez-vous ces paradoxes ?
Spyros Makridakis
La première idée concernant la prévision est d’essayer de trouver des modèles dans les données historiques, puis de les extrapoler afin de prédire l’avenir.
L’autre élément tout aussi important dans ce domaine est d’évaluer l’incertitude de la prévision, car quelle que soit la qualité de nos prévisions, elles ne seront pas exemptes d’erreurs. Nous devons donc spécifier des intervalles de prédiction pour tenir compte de l’incertitude qui est toujours présente lorsque nous essayons de prédire l’avenir.
Malgré des prévisions plus précises, nous assistons parfois à un manque de volonté politique pour mettre en œuvre des solutions et prendre des mesures. Y a-t-il une façon de formuler vos résultats qui pourrait peut-être aider à accélérer ces prises de conscience ?
Oui, mais commençons par un exemple concret.
Nous allons tous au supermarché pour acheter les choses dont nous avons besoin. Combien de fois ne trouvons-nous pas ce que nous cherchons ? En de rares occasions en réalité, car la plupart du temps, nous trouvons ce que nous voulons. Pour cela, nous avons recours à un processus élaboré d’analyse des données dans lequel nous analysons les articles vendus dans le passé au supermarché afin de découvrir des modèles et des relations et, grâce à cette évaluation, de décider des articles à mettre à disposition.
Nous avons récemment organisé un concours de prévision avec les données de Walmart, le plus grand détaillant américain. Le but était d’analyser et de prévoir ses ventes futures sur la base de ces données. Nous avons réussi à prédire la demande pour chacun des plus de 40 000 articles que nous avons inclus dans ce concours de prévision. Walmart possède près de 2 000 magasins aux États-Unis et chaque magasin vend plus de 200 000 articles, ce qui signifie qu’il effectue près de 2,4 milliards de prévisions chaque semaine pour que les clients puissent trouver l’article qu’ils souhaitent. Dans ce type de prévisions opérationnelles, la politique a peu de place. La prévision est aussi objective que possible et c’est son principal avantage pour éviter les biais subjectifs qui détériorent sa précision et son évaluation de l’incertitude. C’est le type de prévision opérationnelle qui a connu de nombreux progrès et qui est utilisé par pratiquement tous les grands détaillants avec des avantages significatifs en termes de réduction des coûts et d’augmentation de la satisfaction des clients. Mais il existe également d’autres types de prévisions où les considérations politiques et même personnelles jouent un rôle essentiel.
En ce moment, on parle beaucoup de récession et on s’inquiète beaucoup de l’inflation élevée. De nombreux pays connaissent une inflation de plus de 10 % pour les produits de consommation – la plus élevée de ces 40 dernières années. Comment pouvons-nous prévoir les conséquences d’une récession associée à une forte inflation ? Nous ne pouvons pas modéliser les récessions passées couplées à une forte inflation de façon à prévoir ce qui pourrait se passer dans notre cas spécifique. Le domaine de la prévision est en partie opérationnel – basé sur des données historiques passées – et en partie discrétionnaire – où nous n’avons aucun moyen d’identifier et d’extrapoler les modèles passés pour prédire leur avenir. Nous devons donc toujours tenir compte de l’incertitude liée à la prévision et prendre des mesures pour envisager ses implications.
Pouvez-vous nous en dire plus sur ces implications ?
Prenons un exemple précis. Lorsque nous allons à l’aéroport pour prendre un avion, nous ne voulons pas y aller trop tôt et rester là à l’attendre, mais nous ne voulons pas non plus le manquer en étant en retard. Cependant, de nombreuses choses peuvent se produire, comme un accident, et avoir un impact considérable sur le temps nécessaire pour se rendre à l’aéroport. C’est à nous de décider combien de temps supplémentaire nous devons prévoir. Ce qui est clair, cependant, c’est que le coût d’aller à l’aéroport plus tôt ou plus tard n’est pas symétrique. Si nous y allons tôt, le pire qui puisse nous arriver est de devoir attendre et de lire un journal ou de boire une tasse de café, mais si nous partons plus tard, nous raterons notre vol et cela pourra nous coûter très cher s’il s’agit d’un vol longue distance.
C’est ce que font aussi les supermarchés. Ils calculent la probabilité de ne pas trouver l’article que vous recherchez et estiment les coûts impliqués par le bénéfice de ne pas faire la vente ainsi que le mécontentement du client qui ne trouve pas ce qu’il veut. Ils mettent ensuite en balance le bénéfice de l’achat de l’article et la perte si le client ne parvient pas à le trouver et s’il est en plus mécontent.
Vous aimez repartir d’exemples concrets. Pensez-vous que ce soit une approche particulièrement pertinente dans le cas des prévisions ?
Le problème des prévisions est qu’il y a trop de facteurs qui influencent le résultat – comme par exemple le prix d’un produit, le prix de produits similaires, les promotions, la publicité et la zone où le produit est placé. Il y a un grand intérêt à identifier ces facteurs et à les utiliser pour améliorer la précision des prévisions et évaluer correctement le niveau d’incertitude. Il s’agit d’un vaste domaine de recherche, avec des centaines d’articles publiés chaque année pour aider les entreprises à faire des prévisions plus précises et à mieux évaluer l’incertitude. Les avantages potentiels sont énormes et des efforts considérables sont déployés pour découvrir et exploiter ces facteurs mais aussi mesurer leur influence sur la précision des prévisions et l’incertitude.
Pensez-vous que les méthodes de prévision pourraient être utilisées pour d’autres secteurs ?
Sans aucun doute ! Les prévisions sont nécessaires pour toutes les décisions futures. Cependant, nous devons toujours garder à l’esprit qu’elles ne sont pas une boule de cristal. Ce que nous faisons, c’est trouver des modèles et des relations passées, les extrapoler pour prédire leur avenir. Elles fonctionnent tant que ces modèles et relations ne changent pas. Par exemple, vous pouviez prédire assez précisément le nombre de passagers des avions jusqu’à la fin de l’année 2019. En 2020, cependant, le Covid est arrivé et les prédictions sont passées de très précises à extrêmement inexactes parce qu’il n’y avait pratiquement aucune personne voyageant en avion en 2020. Il n’y avait rien que l’on puisse faire, à part accepter que les prévisions ne sont pas possibles lorsque les modèles et les relations n’existent pas.
Le Covid-19 a-t-il changé la manière de faire de la prévision ?
Avant 2020, nous disposions de suffisamment de données et nous pouvions les utiliser pour identifier des modèles et des relations et les extrapoler pour prévoir leur continuation. Avant la pandémie, il y avait des schémas et des relations qui se tenaient ; aujourd’hui, nous sommes dans une situation différente et les gens voyagent à nouveau. Les compagnies aériennes devront donc décider, sans beaucoup de données, du nombre de passagers qui voyageront. Cela nécessitera un jugement qui comporte tous les problèmes et les préjugés, sans pouvoir utiliser les informations objectives qui proviennent de l’identification des modèles et des relations passées et en étant obligé d’utiliser un jugement qui peut être influencé par l’optimisme et une série d’autres préjugés.
Vous avez lancé une série de concours de prévision, les M Competitions. Pouvez-vous nous en dire plus sur les raisons qui vous ont poussé à les lancer ?
Le domaine de la prévision a beaucoup progressé grâce à ces concours. Ils sont la chose la plus proche que nous ayons de l’expérimentation en laboratoire, largement utilisée dans les sciences physiques et les sciences de la vie pour décider de la meilleure façon d’avancer.
Nous travaillons avec des quantités colossales de données. Dans le concours M4, par exemple, 100 000 séries chronologiques de données ont été utilisées. Nous cachons la dernière tranche des données et donnons le reste aux concurrents, en leur demandant de prévoir les données cachées dont ils ne disposent pas. Nous trouvons alors les méthodes les plus précises en termes de prévision et d’évaluation de l’incertitude. Nous utilisons ensuite ces informations pour améliorer non seulement la théorie, mais surtout la pratique de la prévision. C’est ce qui a rendu le domaine de la prévision différent de certains autres domaines des sciences sociales où de tels concours ne sont pas organisés. Walmart, dont nous utilisons les données dans un autre concours, sait maintenant quelle est la meilleure façon de prévoir et d’évaluer l’incertitude et a économisé des millions de dollars grâce à ces connaissances. Plus de 6 000 personnes ont concouru et le gagnant a proposé une méthode qui était plus de 22 % plus précise que la meilleure méthode statistique disponible à l’époque.
Votre domaine se numérise rapidement, l’Intelligence artificielle (IA) occupant une place de plus en plus centrale. Êtes-vous optimiste à ce sujet ou pensez-vous que cela pourrait mettre en danger la discipline ?
Nous avons constaté une grande amélioration en passant des méthodes statistiques aux méthodes basées sur l’IA. Ces améliorations sont significatives au plus haut niveau d’agrégation et diminuent aux niveaux inférieurs, mais dans l’ensemble, nous constatons de grandes améliorations. Le plus grand avantage des méthodes basées sur l’IA est qu’elles découvrent d’elles-mêmes des modèles et des relations et les utilisent ensuite pour améliorer la précision et le calcul de l’incertitude. L’IA a un fort potentiel pour améliorer encore le domaine des prévisions. La grande différence avec l’IA est que la méthode elle-même améliore les prévisions et le degré d’incertitude. La personne qui a remporté le concours M5 pour Walmart était un étudiant de premier cycle sans expérience ni connaissance de la science prédictive. Le modèle qu’il a mise en place a décidé lui-même de la meilleure façon de prévoir et d’évaluer l’incertitude. L’étudiant n’avait qu’à utiliser un modèle standard d’apprentissage automatique qu’il devait affiner pour en améliorer la précision. Le modèle a fait plus de 40 000 prédictions sur les données réelles du Walmart en se basant sur une méthode d’IA faisant tout par elle-même.
L’utilisation des méthodes d’apprentissage automatique implique un changement du rôle du prévisionniste. Auparavant, le prévisionniste essayait d’identifier les meilleurs relations pour dégager des modèles. Désormais, dans la mesure où la machine peut le faire, le rôle de la personne impliquée devra être différent et se déplacer vers la façon d’améliorer la partie de jugement de la prévision en incorporant de nouvelles informations non disponibles dans les données – par exemple une grande promotion ou une réduction de prix. Le défi consistera donc à améliorer la valeur fournie par les méthodes d’apprentissage automatique en se concentrant sur les informations non disponibles pour l’algorithme d’apprentissage automatique.
La prévision devient-elle politique ?
La question essentielle est de savoir dans quelle mesure il est possible de prévoir raisonnablement bien ce qui est nécessaire.
Si vous prenez des choses comme des décisions politiques ou des questions plus générales, nous ne disposons généralement pas de suffisamment d’informations quantitatives en termes de données historiques pour fonder nos prévisions. Nous devons nous appuyer davantage sur des données d’appréciation qui peuvent être hautement politiques et donc influencées par nos objectifs personnels et nos préférences quant à ce que nous aimerions qu’il se passe et, malheureusement, par nos propres biais. Par exemple, les hommes d’affaires sont plus souvent optimistes dans leurs prévisions qu’ils ne sont pessimistes, car ils croient qu’ils vont réussir et qu’ils parviendront à atteindre leurs objectifs. Des prévisions exactes doivent toutefois faire la part des choses entre les sentiments personnels et l’optimisme, tout en évitant les préjugés. L’un des avantages des prévisions objectives, fondées sur des données, est qu’elles partent du principe que l’avenir se poursuivra de la même manière que le passé, en supposant une situation stable. L’étape suivante consiste à inclure des indications sur la manière dont les changements de modèles ou de relations affecteront l’avenir et sur les types d’ajustements qu’il faudra apporter à nos prévisions.
Pensez-vous que nous faisons davantage confiance à la science prédictive de nos jours ?
Dans certains domaines, comme les sciences physiques et même les prévisions météorologiques, la réponse est clairement oui. Dans les sciences sociales, la réponse est non, car il existe d’énormes désaccords, même parmi les meilleurs experts. Un bon exemple est le désaccord sur la façon de faire face à la pandémie de Covid. Bien sûr, les choses sont plus faciles avec les prévisions opérationnelles telles que le nombre de bouteilles de lait ou de bière que les supermarchés devront stocker. Ces informations peuvent être trouvées en analysant les données historiques sur les ventes de lait et de bière, puis en développant un modèle permettant de prendre la décision automatiquement. Il n’en va pas de même, cependant, lorsqu’il s’agit de décider des fermetures ou du port de masques dans les lieux publics, car des facteurs politiques entrent dans le processus décisionnel. Cela nous ramène au jugement et à ce que les responsables politiques croient – ou ont tout intérêt à croire – plutôt qu’à une analyse objective de tous les facteurs en jeu.
Cela nous ramène au problème de l’incertitude.
Les implications de l’incertitude sont étroitement liées à la prévision car elles ne sont pas symétriques. Nous avons mentionné l’exemple d’aller à l’aéroport pour prendre un vol. Ce n’est pas la même chose si vous y allez trop tôt ou si vous y allez même un peu plus tard que lorsque la porte d’embarquement de votre vol a fermé. La même asymétrie s’applique à de nombreuses situations de la vie réelle. Pour une entreprise automobile, tout change si elle se met à produire trop de voitures ou au contraire pas assez. Dans le premier cas, elle va subir de nombreuses dépenses et aura un large stock de voitures en attente d’être vendues. Dans le second cas, elle manquera des bénéfices potentiels en n’ayant pas assez de voitures à vendre. Les dirigeants doivent prendre en compte les facteurs en jeu et tenter d’équilibrer les coûts de production d’un trop grand nombre de voitures et ceux d’un manque de voitures en cas de forte demande.
Le problème avec ce qui se passe actuellement – une inflation élevée et la possibilité qu’une récession frappe l’économie mondiale – est que ce n’est pas quelque chose qui peut être quantifié de manière objective, ou que l’IA pourra aider à prédire plus précisément. L’incertitude est élevée et les prédictions doivent être fondées sur le jugement, les opinions variant considérablement entre les experts. Certains jours, nous recevons deux ou trois avis différents sur le moment où elle commencera, sur sa profondeur, sur son impact sur l’économie mondiale et sur la question de savoir si elle touchera davantage l’Europe que les États-Unis ou la Chine. La science prédictive trouve ici ses limites. Il n’y a rien à quoi vous puissiez répondre objectivement, vous devez vous fier à votre propre jugement pour décider mais aussi accepter les limites de ce que vous pouvez et ne pouvez pas prévoir.