Alors que l’ensemble de l’industrie mondiale se mobilise pour répondre, chacun à sa manière, au défi que représente la pandémie de Covid-19, plusieurs initiatives de grande envergure autour de l’utilisation des moyens numériques de très haute performance ont vu le jour. Il s’agit notamment du COVID-19 High Performance Computing Consortium (COVID-19 HPC Consortium) aux USA, de l’initiative européenne Exscalate4CoV (E4C) et de la mobilisation du réseau européen PRACE. Une lueur d’espoir pour la mise au point rapide de médicaments et de vaccins grâce au numérique.
Face au Covid-19, peu à peu la planète se mobilise pour répondre dans l’urgence à la pénurie de matériels de protection pour les soignants et de certains équipements médicaux tels les respirateurs. Tout le monde s’y met. Des industriels du textile ou de la filtration adaptent leur production pour fabriquer des masques, d’autres utilisent leurs lignes de production de cosmétiques pour fournir du gel hydro-alcoolique, enfin, seuls ou en consortium, certains étudient et produisent des respirateurs artificiels, alors que d’autres utilisent leurs imprimantes 3D pour fournir des équipements faisant l’objet de pénurie. Saluons à ce propos la mobilisation des écoles d’ingénieurs, des lycées techniques, des fablab, ainsi que des makers, qui ont enrôlé leurs imprimantes 3D pour produire ces pièces indispensables en nombre.
| Les membres du COVID-19 HPC Consortium
Industriels :
Académiques :
Laboratoires du Department of Energy :
Agences fédérales :
|
Mais la mobilisation existe aussi à un autre niveau, numérique cette fois, pour suivre, modéliser et prévoir l’évolution de la pandémie, ainsi que pour développer rapidement des médicaments efficaces pour lutter contre la maladie et disposer à terme d’un vaccin. Tous les outils numérique de pointe sont appelés au front, qu’il s’agisse de Big Data, d’Intelligence Artificielle, de Calcul Haute Performance (HPC) ou de Simulation Numérique. Il s’agit de mener le plus rapidement possible des recherches approfondies dans des domaines tels que la bioinformatique, l’épidémiologie et la modélisation moléculaire pour comprendre la menace à laquelle nous sommes confrontés et élaborer des stratégies pour y faire face.
Ce travail nécessite une énorme capacité de calcul qui impose la mise en commun des multiples moyens existants. Il s’agit le plus souvent de consortiums créés au niveau des états, comme pour le COVID-19 High Performance Computing Consortium (COVID-19 HPC Consortium) aux USA ou l’initiative européenne Exscalate4CoV (E4C) et de la mobilisation du consortium européen PRACE.
402 PFlop/s au service de la science aux USA
Lancé par l’Office of Science & Technology Policy de la Maison Blanche et le US Department of Energy, aidé par des agences fédérales, des laboratoires d’état et universitaires, ainsi que par de grands industriels, le COVID-19 HPC Consortium a pour objectif de mettre gratuitement une énorme puissance de calcul à la disposition des chercheurs pour lutter contre la pandémie. Il regroupe aujourd’hui une trentaine de systèmes totalisant 105 334 nœuds de calcul (3 539 044 CPU et 41 286 GPU) offrant une puissance de calcul globale de 402 PFlop/s.
Pour monter l’importance de cet effort, rappelons que le dernier classement mondial des supercalculateurs effectué par Top500 plaçait la machine Summit du Oak Ridge National Laboratory au sommet de la pyramide mondiale avec une puissance de 148,8 PFlop/s. La puissance offerte par le COVID-19 HPC Consortium équivaut aujourd’hui à celle cumulée des 4 plus gros supercalculateurs installés dans le monde !
Les chercheurs sont invités à soumettre leurs projets de recherche via un portail à un comité de scientifiques de haut niveau qui en évalue la pertinence par rapport à l’objectif d’améliorer la santé publique face à la pandémie et leur attribue une partie de la puissance informatique disponible. Une douzaine de projets de recherches ont déjà été sélectionnés.
Notons que l’entité Watson Health d’IBM a mis gratuitement son système de développement clinique à la disposition des agences nationales américaines de santé, afin d’aider à accélérer le développement des traitements médicamenteux. Il s’agit d’une technologie, basée sur l’Intelligence Artificielle, utilisée par les sociétés pharmaceutiques pour réduire le temps/coût des essais cliniques en centralisant et en organisant les détails des essais cliniques, et qui permet d’accéder aux données des essais cliniques à partir de n’importe quel appareil connecté au web.
Plusieurs initiatives en Europe
| Les membres de l’initiative Exscalate4CoV
Industriels
Académiques
Centres de calcul
|
De son côté, l’Europe entend aussi apporter une réponse numérique collective au challenge que pose cette pandémie. Ainsi, dès le 30 janvier 2020, la Commission européenne a lancé une demande de manifestation d’intérêt intitulée : ‘‘SC1-PHE-CoronaVirus-2020 : Faire progresser les connaissances pour la réponse clinique et de santé publique à l’épidémie Covid-19’’. Dotée d’un budget initial de 10 millions d’euros celui-ci a été porté à 47,5 millions d’euros financé dans le cadre du programme de recherche H2020. 17 projets sur les coronavirus ont déjà été présélectionnés dont celui du consortium Exscalate4CoV (E4C), qui lui est déjà financé à hauteur de 3 M€.
Ce projet vise à exploiter la plate-forme logicielle EXaSCale smArt pLatform Against paThogEns (EXSCALATE), ainsi que les ressources informatiques les plus puissantes actuellement basées en Europe pour permettre la conception intelligente de médicaments in-silico. E4C est un réseau entièrement intégré conçu pour réaliser une série continue de simulations in-silico, suivies d’une validation expérimentale in-vitro, afin d’accélérer l’identification de composés actifs en vue de les tester chez l’homme en tant que nouveaux traitements pour Covid-19.
L’Institut Suisse de Bioinformatique (SIB) fournira les modèles d’homologie pour les protéines virales à cribler virtuellement. Le Fraunhofer IME fournira la Broad Repurposing Library de Fraunhofer et des analyses biochimiques pour le criblage contre les protéases, les ligases et les polymérases des coronavirus. Parallèlement aux tests biochimiques, des tests phénotypiques seront également effectués par l’université belge KU Lueven pour identifier les molécules capables de bloquer la réplication du virus dans des modèles in-vitro. Parallèlement aux modèles d’homologie, le polonais IIMCB et l’italien ELETTRA détermineront la structure cristalline d’au moins une protéine fonctionnelle de coronavirus pour améliorer encore la qualité des modèles in-silico et évaluer les similitudes structurelles avec d’autres protéines virales. L’ensemble du processus permettra d’identifier rapidement des molécules actives et sûres en vue d’être utilisées dans des essais cliniques sur des animaux, puis sur l’homme.
Partager les résultats
Pour accélérer encore l’identification des médicaments par l’E4C pour la prochaine pandémie, SIB fournira son flux de travail automatisé, évolutif, robuste, documenté et étalonné qui produit des modèles d’homologie annotés directement à partir du génome séquencé du virus. Les modèles générés permettront l’analyse et l’interprétation efficaces des produits de protéines virales et seront immédiatement disponibles sur la plate-forme EXSCALATE pour un criblage virtuel. Ces activités de dépistage virtuel massives nécessitent une énorme ressource de calcul, par conséquent, les activités sont soutenues par trois des centres informatiques les plus puissants d’Europe, à savoir l’italien CINECA, l’espagnol BSC et l’allemand Jülich. Ces trois centres de calcul seront en mesure de garantir conjointement la meilleure combinaison d’architectures matérielles, les connaissances requises et l’accélération la plus élevée pour les simulations. De plus, l’italien INFN (centre de niveau 1 du CERN) mettra à disposition son infrastructure de partage de données et à haut débit pour faciliter l’exploitation des produits.
En tant que système basé sur les connaissances, le projet E4C bénéficiera de l’infrastructure de SIB, en particulier pour les aspects phylogénétiques, co-évolutifs et pathogéniques des caractérisations bioinformatiques clés virales (c’est-à-dire les séquences d’ARN et de protéines). La quantité considérable d’informations sur les séquences provenant de toutes les communautés scientifiques et des hôpitaux sera captée en toute sécurité par les pipelines consolidés de plusieurs bases de données publiques. Le Consortium E4C se référera à SIB et à son réseau pour obtenir les dernières données et analyses de séquence.
Le projet E4C partagera rapidement ses résultats scientifiques avec la communauté de la recherche en utilisant des canaux établis comme le portail ChEMBL pour les données biochimiques, le portail SWISS-MODEL pour les modèles d’homologie des protéines virales WT et des mutants, la Protein Data Bank pour les structures protéiques trouvées expérimentalement, l’EUDAT pour les données générées par les simulations in-silico et le site web du projet E4C.
Un seul regret, l’absence de participants français à ce projet européen ! Heureusement il y a d’autres projets collectifs en Europe et en France
PRACE mobilise 150 PFlop/s en Europe
Ainsi, le consortium Partnership for Advanced Computing in Europe (PRACE), qui regroupe 26 états européens depuis 2010, a lancé un appel à projets dès le 24 mars.
Plusieurs des plus grands centres européens de calcul sont impliqués dans cette démarche : le Gauss Center for Supercomputing – GCS (Allemagne) qui regroupe le centre de calcul haute performance de Stuttgart (HLRS), le centre de supercalculateurs Jülich (JSC) et le centre de supercalculateur Leibniz (LRZ) ; le IT Centre for Science – CSC (Finlande) ; le Grand équipement national de calcul intensif – GENCI (France) qui regroupe les supercalculateurs Joliot-Curie de 22,7 PFlop/s du Très Grand Centre de calcul du CEA (TGCC), Jean Zay de 14 PFlop/s de l’Institut du développement et des ressources en informatique scientifique (IDRIS – CNRS) et Occigen de 3,5 PFlop/s du Centre informatique national de l’enseignement supérieur (CINES) ; le Centre irlandais pour le calcul haute performance – ICHEC (Irlande) ; le Vlaams Supercomputer Centrum – VSC (Belgique) ; le IT4Innovations National Supercomputing Center (République tchèque) ; le Computing Center of the Slovak Academy of Sciences – CCSAC (Slovaquie) ; le Centro Svizzero di Calcolo Scientifico – CSCS/ETH Zürich (Suisse). Un ensemble qui représente plus de 150 PFlop/s mis à la disposition des chercheurs.
Pour le moment, PRACE a déjà sélectionné le projet COVID-HP du Professeur Jean-Philipe Piquemal, de l’Université Paris Sorbonne. En voici les grandes lignes. Face à la pandémie croissante causée par le rétrovirus SARS-CoV-2 (Covid-19), il existe un besoin urgent d’inhibiteurs capables de cibler sélectivement certaines de ses protéines clés, mais peut-être aussi des séquences d’acide nucléique clés dans son génome. Ce projet, qui regroupe un consortium d’équipes complémentaires, s’appuie sur plusieurs atouts :
- La fourniture récente de structures à haute résolution de plusieurs protéines Covid-19 ;
- La disponibilité d’un nouveau logiciel de dynamique moléculaire polarisée, Tinker-HP, pour obtenir une qualité de simulation qui ne peut être atteinte avec d’autres logiciels ;
- La possibilité de retraiter les trajectoires de Tinker-HP via un ensemble de logiciels de criblage et d’amarrage, pour tester de nouvelles molécules actives contre Covid-19.
Partout dans le monde
Signalons aussi des initiatives de moindre envergure au Japon, RIKEN Center for Biosystems Dynamics Research – BDR ; à Singapour, National Supercomputing Centre – NSCC ; en Afrique du Sud, Centre for High Performance Computing – CHPC ; en Russie, Joint Supercomputer Center of the Russian Academy of Sciences – JSCC RAS ; en Australie, National Computational Infrastructure – NCI, et Pawsey Supercomputing Centre – PSCC.
Enfin, le monde de l’Open Source s’attèle aussi à la tache, puisque les japonais du National Bioscience Database Center (NBDC) et du Database Center for Life Science (DBCLS), qui organisent depuis 2008 un BioHackathon annuel, viennent de lancer un Covid-19 BioHackathon.
Bref, une mobilisation numérique qui se veut mondiale ! Reste à attendre les résultats.
Jean-François Prevéraud
Pour en savoir plus :
USA : https://covid19-hpc-consortium.org/
Europe : https://ec.europa.eu/commission/presscorner/detail/en/ip_20_386
Exacalate : https://www.exscalate.eu/en/index.html et https://www.exscalate4cov.eu/
PRACE : https://prace-ri.eu/eu-hpc-fights-covid-19/
Japon : https://www.riken.jp/en/news_pubs/news/2020/20200323_1/index.html
Afrique du Sud : https://sacoronavirus.co.za/
Russie : https://insidehpc.com/2020/03/russian-supercomputer-joins-the-fight-against-covid-19/
Australie : https://nci.org.au/covid-19-accelerated-access-initiatives et
BioHackathon : https://github.com/virtual-biohackathons/covid-19-bh20
