Paris. L’annonce a été rapidement relayée dans la communauté scientifique européenne, lorsque l’Institut Pasteur a annoncé avoir complètement séquencé les échantillons du Coronavirus (nCoV2019) le 29 janvier 20201. Tout comme pour les premières séquences du virus, relâchées dès le début de l’épidémie par des équipes chinoises, les séquences, ainsi que d’autres informations sur les patients touchés, ont été publiquement mises en ligne et donc mis à la disposition libre de tous les chercheurs.2

D’un point de vue pratique, la traque du virus et le recueil des connaissances a rarement été aussi ouverte. Plusieurs éditeurs ont ainsi annoncé la mise à disposition gratuite des articles en lien avec l’épidémie et ont accéléré le processus de relecture des articles. Cependant, au delà de ce geste, c’est l’emploi massif des portails biorXiv et medRxive, qui sont des entrepôts de pre-prints permettant le libre accès à des articles n’ayant pas encore passé la barrière de la revue par les pairs, et de Twitter qui fait office de lieu de peer-review. C’est ainsi toute la chaîne du contrôle scientifique (divulgation des données, présentation des analyses et revue par les pairs) qui a été en partie fait à la vue de tous. Et cela paie : la production scientifique autour du Coronavirus a connu un développement sans précédent et la divulgation des résultats et des données a probablement permis à de très nombreuses équipes de recherche de rapidement corriger leurs erreurs et d’accélérer la production des connaissances3 .

Coronavirus research, recherche sur le Coronavirus Janvier 2020
Image tirée de Nature. Nombre d’articles déposés dans des journaux à comité de lecture et sur les répertoires en ligne bioRxiv, medRxiv and chemRxiv.

Il convient de placer cette évolution en contraste avec le processus plus classique d’évaluation de la recherche, consistant à soumettre un article à un éditeur, qui va le transmettre à des relecteurs. Ces derniers évaluent la pertinence du travail ainsi que sa qualité scientifique et acceptent ou non la publication. Ce système est actuellement très critiqué pour des nombreuses raisons que nous ne développerons pas ici. Cependant dans le cas de l’épidémie que nous connaissons actuellement, le problème central sont les délais liés au nombreux allers-retours entre auteurs, éditeurs et relecteurs, ainsi que le partage des données brutes et du code ayant permis l’obtention des résultats, rendant la réplication des analyses plus contraignante.

Les communautés médicale et scientifique ne sont que deux de plus à s’ouvrir au public et rendre plus transparents leurs travaux. A titre d’exemple, on peut par exemple citer tout l’écosystème de lutte contre les djihadistes orchestré par la Katiba des Nervalos, ou encore Bellingcat et la communauté d’anonymes et de professionnels effectuant du journalisme d’investigation en ligne. Même les États ressentent une certaine pression à ouvrir l’accès aux données avec le mouvement Open Data, ou y voient une manière de susciter l’innovation et créer de nouvelles applications à partir de bases de données déjà existantes. L’émulation résultant de l’ouverture des sources et des méthodes de travail est efficace au court terme, mais a aussi été démontré dans le long terme, en particulier par l’ouverture du code source des logiciels. En effet, comme le montre Frank Nagel4, cela a des conséquences très pratiques comme une montée en gamme du code écrit (puisque l’on peut étudier en temps réel les meilleures pratiques sur des plateformes telles que GitHub) et donc des gains de productivité significatifs dans les écosystèmes pratiquant communément l’open source .

Cette ouverture de la science reflète aussi en partie la démocratisation des outils de développement ouverts. D’une part les réseaux sociaux, d’autre part les outils d’archivage d’articles et de codes ouverts des articles tels BioRxiv et GitHub. C’est donc l’existence de ces supports en conjonction avec la crise exceptionnelle du Coronavirus qui a permis à ces nouveaux usages de se développer. Reste maintenant à savoir si les pratiques vont perdurer.

Sources
  1. L’Institut Pasteur séquence le génome complet du coronavirus de Wuhan, 2019-nCov, Communiqué de Presse, 30 janvier 2020
  2. Page de Github sur le 2019-nCov
  3. ROGERS Adam, Coronavirus Research Is Moving at Top Speed—With a Catch, Wired, 31 janvier 2020
  4. NAGLE Frank, Open Source Software and Firm Productivity, Management Science, Volume 65, issue 3, mars 2019