Article paru dans notre lettre d'information du 16 avril 2020

Covid-19 : une mobilisation numérique mondiale !

Alors que l’ensemble de l’industrie mondiale se mobilise pour répondre, chacun à sa manière, au défi que représente la pandémie de Covid-19, plusieurs initiatives de grande envergure autour de l’utilisation des moyens numériques de très haute performance ont vu le jour. Il s’agit notamment du COVID-19 High Performance Computing Consortium (COVID-19 HPC Consortium) aux USA, de l’initiative européenne Exscalate4CoV (E4C) et de la mobilisation du réseau européen PRACE. Une lueur d’espoir pour la mise au point rapide de médicaments et de vaccins grâce au numérique.

Représentation de l'interaction de la protéine Spike (S) avec le récepteur ACE-2 de la cellule-cible humaine (en gris). Image issue de simulations HPC réalisées à Sorbonne Université à l'aide de la machine Jean Zay et du logiciel Tinker-HP.
(cliquer sur l'image pour l'agrandir)

Face au Covid-19, peu à peu la planète se mobilise pour répondre dans l’urgence à la pénurie de matériels de protection pour les soignants et de certains équipements médicaux tels les respirateurs. Tout le monde s’y met. Des industriels du textile ou de la filtration adaptent leur production pour fabriquer des masques, d’autres utilisent leurs lignes de production de cosmétiques pour fournir du gel hydro-alcoolique, enfin, seuls ou en consortium, certains étudient et produisent des respirateurs artificiels, alors que d’autres utilisent leurs imprimantes 3D pour fournir des équipements faisant l’objet de pénurie. Saluons à ce propos la mobilisation des écoles d’ingénieurs, des lycées techniques, des fablab, ainsi que des makers, qui ont enrôlé leurs imprimantes 3D pour produire ces pièces indispensables en nombre.

Les membres du COVID-19 HPC Consortium

Industriels :
  •     Amazon Web Services
  •     AMD
  •     Google Cloud
  •     Hewlett Packard Enterprise
  •     IBM
  •     Microsoft
  •     NVidia.
Académiques :
  •     Massachusetts Institute of Technology
  •     Rensselaer Polytechnic Institute
  •     University of Illinois
  •     University of Texas at Austin
  •     University of California - San Diego
  •     Carnegie Mellon University
  •     University of Pittsburgh
  •     Indiana University
  •     University of Wisconsin-Madison
Laboratoires du Department of Energy :
  •     Argonne National Laboratory
  •     Lawrence Livermore National Laboratory
  •     Los Alamos National Laboratory
  •     Oak Ridge National Laboratory
  •     National Energy Research Scientific Computing Center
  •     Sandia National Laboratories.
Agences fédérales :
  •     National Science Foundation
  •     NASA

Mais la mobilisation existe aussi à un autre niveau, numérique cette fois, pour suivre, modéliser et prévoir l’évolution de la pandémie, ainsi que pour développer rapidement des médicaments efficaces pour lutter contre la maladie et disposer à terme d’un vaccin. Tous les outils numérique de pointe sont appelés au front, qu’il s’agisse de Big Data, d’Intelligence Artificielle, de Calcul Haute Performance (HPC) ou de Simulation Numérique. Il s’agit de mener le plus rapidement possible des recherches approfondies dans des domaines tels que la bioinformatique, l'épidémiologie et la modélisation moléculaire pour comprendre la menace à laquelle nous sommes confrontés et élaborer des stratégies pour y faire face.

Ce travail nécessite une énorme capacité de calcul qui impose la mise en commun des multiples moyens existants. Il s’agit le plus souvent de consortiums créés au niveau des états, comme pour le COVID-19 High Performance Computing Consortium (COVID-19 HPC Consortium) aux USA ou l’initiative européenne Exscalate4CoV (E4C) et de la mobilisation du consortium européen PRACE.

402 PFlop/s au service de la science aux USA

Lancé par l’Office of Science & Technology Policy de la Maison Blanche et le US Department of Energy, aidé par des agences fédérales, des laboratoires d’état et universitaires, ainsi que par de grands industriels, le COVID-19 HPC Consortium a pour objectif de mettre gratuitement une énorme puissance de calcul à la disposition des chercheurs pour lutter contre la pandémie. Il regroupe aujourd’hui une trentaine de systèmes totalisant 105 334 nœuds de calcul (3 539 044 CPU et 41 286 GPU) offrant une puissance de calcul globale de 402 PFlop/s.

Pour monter l’importance de cet effort, rappelons que le dernier classement mondial des supercalculateurs effectué par Top500 plaçait la machine Summit du Oak Ridge National Laboratory au sommet de la pyramide mondiale avec une puissance de 148,8 PFlop/s. La puissance offerte par le COVID-19 HPC Consortium équivaut aujourd’hui à celle cumulée des 4 plus gros supercalculateurs installés dans le monde !

Les chercheurs sont invités à soumettre leurs projets de recherche via un portail à un comité de scientifiques de haut niveau qui en évalue la pertinence par rapport à l’objectif d’améliorer la santé publique face à la pandémie et leur attribue une partie de la puissance informatique disponible. Une douzaine de projets de recherches ont déjà été sélectionnés.

Notons que l'entité Watson Health d'IBM a mis gratuitement son système de développement clinique à la disposition des agences nationales américaines de santé, afin d'aider à accélérer le développement des traitements médicamenteux. Il s'agit d'une technologie, basée sur l’Intelligence Artificielle, utilisée par les sociétés pharmaceutiques pour réduire le temps/coût des essais cliniques en centralisant et en organisant les détails des essais cliniques, et qui permet d'accéder aux données des essais cliniques à partir de n'importe quel appareil connecté au web.

Plusieurs initiatives en Europe

Les membres de l’initiative Exscalate4CoV

Industriels
  •     Chelonia (Suisse)
  •     Dompé (Italie)
Académiques
  •     Elettra Sincrotrone Trieste (Italie)
  •     Fraunhofer IME (Allemagne)
  •     International Institute of Molecular and Cell Biology - IIMCB (Pologne)
  •     National Institute for Infectious Diseases - INMI (Italie)
  •     National Institute for Nuclear Physics – INFN (Italie)
  •     Politecnico di Milano (Italie)
  •     Royal Institute of Technology – KTH (Suéde)
  •     Swiss Institute of Bioinformatics – SIB (Suisse)
  •     Université de Cagliari- UNICA Team (Italie)
  •     Université KU Leuven (Belgique)
  •     Université de Milan (Italie)
  •     Université de Naples Federico II – UNINA (Italie).
Centres de calcul
  •     Associazione Big Data (Italie)
  •     Barcelona Computing Center - BSC (Espagne)
  •     Cineca (Italie)
  •     Fz-Juelich – FZJ (Allemagne)

De son côté, l’Europe entend aussi apporter une réponse numérique collective au challenge que pose cette pandémie. Ainsi, dès le 30 janvier 2020, la Commission européenne a lancé une demande de manifestation d'intérêt intitulée : ‘‘SC1-PHE-CoronaVirus-2020 : Faire progresser les connaissances pour la réponse clinique et de santé publique à l'épidémie Covid-19’’. Dotée d’un budget initial de 10 millions d'euros celui-ci a été porté à 47,5 millions d'euros financé dans le cadre du programme de recherche H2020. 17 projets sur les coronavirus ont déjà été présélectionnés dont celui du consortium Exscalate4CoV (E4C), qui lui est déjà financé à hauteur de 3 M€.

Ce projet vise à exploiter la plate-forme logicielle EXaSCale smArt pLatform Against paThogEns (EXSCALATE), ainsi que les ressources informatiques les plus puissantes actuellement basées en Europe pour permettre la conception intelligente de médicaments in-silico. E4C est un réseau entièrement intégré conçu pour réaliser une série continue de simulations in-silico, suivies d'une validation expérimentale in-vitro, afin d’accélérer l'identification de composés actifs en vue de les tester chez l'homme en tant que nouveaux traitements pour Covid-19.

L'Institut Suisse de Bioinformatique (SIB) fournira les modèles d'homologie pour les protéines virales à cribler virtuellement. Le Fraunhofer IME fournira la Broad Repurposing Library de Fraunhofer et des analyses biochimiques pour le criblage contre les protéases, les ligases et les polymérases des coronavirus. Parallèlement aux tests biochimiques, des tests phénotypiques seront également effectués par l’université belge KU Lueven pour identifier les molécules capables de bloquer la réplication du virus dans des modèles in-vitro. Parallèlement aux modèles d'homologie, le polonais IIMCB et l’italien ELETTRA détermineront la structure cristalline d'au moins une protéine fonctionnelle de coronavirus pour améliorer encore la qualité des modèles in-silico et évaluer les similitudes structurelles avec d'autres protéines virales. L'ensemble du processus permettra d'identifier rapidement des molécules actives et sûres en vue d’être utilisées dans des essais cliniques sur des animaux, puis sur l’homme.

Partager les résultats

Pour accélérer encore l'identification des médicaments par l'E4C pour la prochaine pandémie, SIB fournira son flux de travail automatisé, évolutif, robuste, documenté et étalonné qui produit des modèles d'homologie annotés directement à partir du génome séquencé du virus. Les modèles générés permettront l'analyse et l'interprétation efficaces des produits de protéines virales et seront immédiatement disponibles sur la plate-forme EXSCALATE pour un criblage virtuel. Ces activités de dépistage virtuel massives nécessitent une énorme ressource de calcul, par conséquent, les activités sont soutenues par trois des centres informatiques les plus puissants d'Europe, à savoir l’italien CINECA, l’espagnol BSC et l’allemand Jülich. Ces trois centres de calcul seront en mesure de garantir conjointement la meilleure combinaison d'architectures matérielles, les connaissances requises et l'accélération la plus élevée pour les simulations. De plus, l'italien INFN (centre de niveau 1 du CERN) mettra à disposition son infrastructure de partage de données et à haut débit pour faciliter l'exploitation des produits.

En tant que système basé sur les connaissances, le projet E4C bénéficiera de l'infrastructure de SIB, en particulier pour les aspects phylogénétiques, co-évolutifs et pathogéniques des caractérisations bioinformatiques clés virales (c'est-à-dire les séquences d'ARN et de protéines). La quantité considérable d'informations sur les séquences provenant de toutes les communautés scientifiques et des hôpitaux sera captée en toute sécurité par les pipelines consolidés de plusieurs bases de données publiques. Le Consortium E4C se référera à SIB et à son réseau pour obtenir les dernières données et analyses de séquence.

Le projet E4C partagera rapidement ses résultats scientifiques avec la communauté de la recherche en utilisant des canaux établis comme le portail ChEMBL pour les données biochimiques, le portail SWISS-MODEL pour les modèles d'homologie des protéines virales WT et des mutants, la Protein Data Bank pour les structures protéiques trouvées expérimentalement, l'EUDAT pour les données générées par les simulations in-silico et le site web du projet E4C.

Un seul regret, l’absence de participants français à ce projet européen ! Heureusement il y a d’autres projets collectifs en Europe et en France

PRACE mobilise 150 PFlop/s en Europe

Ainsi, le consortium Partnership for Advanced Computing in Europe (PRACE), qui regroupe 26 états européens depuis 2010, a lancé un appel à projets dès le 24 mars.

Plusieurs des plus grands centres européens de calcul sont impliqués dans cette démarche : le Gauss Center for Supercomputing - GCS (Allemagne) qui regroupe le centre de calcul haute performance de Stuttgart (HLRS), le centre de supercalculateurs Jülich (JSC) et le centre de supercalculateur Leibniz (LRZ) ; le IT Centre for Science - CSC (Finlande) ; le Grand équipement national de calcul intensif - GENCI (France) qui regroupe les supercalculateurs Joliot-Curie de 22,7 PFlop/s du Très Grand Centre de calcul du CEA (TGCC), Jean Zay de 14 PFlop/s de l'Institut du développement et des ressources en informatique scientifique (IDRISCNRS) et Occigen de 3,5 PFlop/s du Centre informatique national de l’enseignement supérieur (CINES) ; le Centre irlandais pour le calcul haute performanceICHEC (Irlande) ; le Vlaams Supercomputer CentrumVSC (Belgique) ; le IT4Innovations National Supercomputing Center (République tchèque) ; le Computing Center of the Slovak Academy of SciencesCCSAC (Slovaquie) ; le Centro Svizzero di Calcolo ScientificoCSCS/ETH Zürich (Suisse). Un ensemble qui représente plus de 150 PFlop/s mis à la disposition des chercheurs.

Pour le moment, PRACE a déjà sélectionné le projet COVID-HP du Professeur Jean-Philipe Piquemal, de l’Université Paris Sorbonne. En voici les grandes lignes. Face à la pandémie croissante causée par le rétrovirus SARS-CoV-2 (Covid-19), il existe un besoin urgent d'inhibiteurs capables de cibler sélectivement certaines de ses protéines clés, mais peut-être aussi des séquences d'acide nucléique clés dans son génome. Ce projet, qui regroupe un consortium d'équipes complémentaires, s'appuie sur plusieurs atouts :

  • La fourniture récente de structures à haute résolution de plusieurs protéines Covid-19 ;
  • La disponibilité d'un nouveau logiciel de dynamique moléculaire polarisée, Tinker-HP, pour obtenir une qualité de simulation qui ne peut être atteinte avec d'autres logiciels ;
  • La possibilité de retraiter les trajectoires de Tinker-HP via un ensemble de logiciels de criblage et d'amarrage, pour tester de nouvelles molécules actives contre Covid-19.

Partout dans le monde

Signalons aussi des initiatives de moindre envergure au Japon, RIKEN Center for Biosystems Dynamics ResearchBDR ; à Singapour, National Supercomputing CentreNSCC ; en Afrique du Sud, Centre for High Performance ComputingCHPC ; en Russie, Joint Supercomputer Center of the Russian Academy of Sciences - JSCC RAS ; en Australie, National Computational InfrastructureNCI, et Pawsey Supercomputing CentrePSCC.

Enfin, le monde de l’Open Source s’attèle aussi à la tache, puisque les japonais du National Bioscience Database Center (NBDC) et du Database Center for Life Science (DBCLS), qui organisent depuis 2008 un BioHackathon annuel, viennent de lancer un Covid-19 BioHackathon.

Bref, une mobilisation numérique qui se veut mondiale ! Reste à attendre les résultats.

Jean-François Prevéraud

 

Pour en savoir plus :

USA : https://covid19-hpc-consortium.org/

Top500 :https://www.top500.org/lists/2019/11/highs/

Europe : https://ec.europa.eu/digital-single-market/en/news/using-european-supercomputing-treat-coronavirus et https://ec.europa.eu/commission/presscorner/detail/en/ip_20_386

Exacalate : https://www.exscalate.eu/en/index.html et https://www.exscalate4cov.eu/

PRACE : https://prace-ri.eu/eu-hpc-fights-covid-19/

GENCI : http://www.genci.fr/fr/node/1036

Japon : https://www.riken.jp/en/news_pubs/news/2020/20200323_1/index.html

Singapour : https://www.nscc.sg/wp-content/uploads/2020/03/NSCC-Media-Release_Singapore’s-national-supercomputer-joins-the-fight-against-COVID-19_final.pdf

Afrique du Sud : https://sacoronavirus.co.za/

Russie : https://insidehpc.com/2020/03/russian-supercomputer-joins-the-fight-against-covid-19/

Australie : https://nci.org.au/covid-19-accelerated-access-initiatives et

https://pawsey.org.au/covid19-accelerated-access/

BioHackathon : https://github.com/virtual-biohackathons/covid-19-bh20

 

Ingénieur de formation (ENIM) et journaliste professionnel depuis 1981, Jean-François Prevéraud a participé à de nombreux journaux et lettres d'information (Bureau d'Etudes, CFAO Synthèse, SIT, Industrie & Technologies, Usine Nouvelle...) comme journaliste, rédacteur en chef adjoint ou rédacteur en chef.

En retraite depuis février 2017, Jean-François veut que celle-ci soit active. C’est pour cette raison qu’il reste informé de ce qui bouge dans le PLM dans son sens le plus large (CFAO, Simulation Numérique, Impression 3D, Usine du futur, Réalité virtuelle et augmentée…). Il contribue désormais à notre lettre d’information pour commenter l’actualité que nous publions ou celle qu’il a pu glaner dans les évènements qu’il continue à suivre.

Vous pouvez accéder ci-dessous à ses derniers articles.