Nous suivre Industrie Techno

LE CNRS MONTE EN PUISSANCE

Thierry Mahé

Sujets relatifs :

,
Le centre national de la recherche scientifique française se dote du troisième plus puissant supercalculateur au monde, hors applications militaires.

En faisant l'acquisition auprès d'IBM d'une machine de 207 téraflops (1 téraflop équivaut à 1 000 milliards d'opérations en virgule flottante par seconde), le CNRS multiplie par près de trente sa puissance de calcul et se hisse au troisième rang mondial de la puissance de calcul civile. Une affaire rondement menée : « Le projet n'aura pris que six mois entre la rédaction du cahier des charges et la mise en service », note Arnold Migus, directeur général du CNRS.

De fait, si la BlueGene/P (machine MPP, voir encadré) sera mise en service dès l'été prochain, la partie SMP à base de processeurs Power 6 est déjà disponible à l'Idris (Institut du développement et des ressources en informatique scientifique) d'Orsay (Essonne), le centre majeur du CNRS pour le calcul numérique intensif.

Le secteur privé pourra profiter du supercalculateur

Seuls le Jülich Supercomputing Centre (près de Cologne, Allemagne) et le Lawrence Livermore National Laboratory (Californie, rattaché au Département américain à l'énergie) font mieux, avec des machines montant respectivement à 223 et 596 téraflops.

Cet investissement s'inscrit en continuité du Genci (Grand équipement national pour le calcul intensif) lancé en janvier 2007, réunissant État, CEA, CNRS et universités, et dont le plan d'investissement est de 25 millions d'euros par an sur quatre ans. Le Genci, constitué en société civile, est fortement ancré sur la coopération entre équipes publiques et privées.

L'acquisition du CNRS, financée sur fonds propres pour un montant de 25 millions d'euros dont quatre ans de maintenance, préfigure cette coopération. Le temps d'utilisation des deux machines de l'Idris sera gratuit pour les chercheurs "maison". Mais le secteur privé profitera de l'aubaine au travers d'un comité de programmes et d'une procédure d'appel à projets. L'utilisation sera payante dans ce dernier cas.

Par ailleurs, le Genci, via un accord signé en novembre par quatorze pays européens, est la composante française de l'initiative Prace qui fonde véritablement le calcul scientifique à l'échelle européenne. Le "cadeau de Noël" fait au CNRS pose donc un jalon important vers l'Europe numérique.

L'étude du changement climatique motive pour une bonne part cet investissement. Autre grand domaine de calcul cité par Catherine Bréchignac, présidente du CNRS, l'étude de la combustion, avec les carburants traditionnels comme les biocarburants. En effet, seul un gain de puissance de 100 permettra d'appréhender les milliers de réactions chimiques d'une flamme. Last, but not least, la biologie et la recherche pharmaceutique.

Le CNRS a fait le choix d'une architecture hybride (voir encadré). Schématiquement, la première machine, SMP, basée sur les puces IBM Power 6, assure la relève de la configuration actuelle de l'Idris (Power 4), dont elle décuple la puissance. C'est une machine à vocation généraliste sur laquelle les codes actuels tournent déjà.

Pour les calculs climatologiques

La deuxième architecture, la BlueGene/P, a un spectre d'application "réduit" aux calculs pouvant massivement être parallélisés, et fera l'objet de travaux plus fondamentaux, en particulier au plan algorithmique. Par ailleurs, c'est cette machine, qui, dans ses évolutions futures (2010-2011), passera la barre mythique du petaflop : un million de milliards d'opérations en virgule flottante par seconde. En dépit de cette hétérogénéité de matériel, d'architecture, et même de système d'exploitation, l'ensemble est vu comme une seule entité au regard des soumissions de calcul.

L'emplette du CNRS est d'autant plus réjouissante qu'elle suit de deux mois la fourniture d'un IBM BlueGene/L de 5,7 téraflops au centre de calcul Cerfacs de Toulouse (Météo France, CNES, Onera, etc.), une configuration appelée à migrer vers BlueGene/P. Or le Cerfacs, qui est avant tout un centre d'expertise, a prouvé que beaucoup d'applications sont extensibles à des milliers, voire des dizaines de milliers de processeurs. Éric Maisonnave, spécialiste de la modélisation climatique au sein de ce centre, montrait récemment, sur un exemple précis, que le calcul sur machine parallèle type IBM BlueGene réduisait d'un facteur quatre le temps de calcul par rapport aux "traditionnelles" machines vectorielles type NEC SR8X de Météo France. Et un monstre comme le code Oasis, qui prend en compte graduellement tous les nouveaux éléments impactant la météo (d'abord les océans, puis les glaciers, les rivières...), est d'emblée conçu dans une perspective massivement parallèle, c'est-à-dire dans la philosophie IBM BlueGene/P.

Rappelons qu'IBM a lancé son programme BlueGene en 1999, spécifiquement pour l'étude des phénomènes biomoléculaires. Les spécialistes de la météo et du changement climatique, traditionnellement attachés aux machines vectorielles comme celle du japonais NEC, s'en emparent. Au prix cependant d'un lourd travail de migration. Idem pour un code d'aérodynamique comme Elsa (Cerfacs, Onera), qui a été testé sur une machine massivement parallèle. Succès : au moins jusqu'à 1 024 processeurs, le temps diminue de façon linéaire avec le nombre de processeurs.

De même, les équipes de l'Idris, suivant en cela les conclusions de leurs confrères américains et allemands, parient sur un nombre beaucoup plus considérable que prévu d'applications "idéalement" massivement parallélisables. Dont les calculs liés au transport turbulent dans un plasma confiné qui sont au coeur du programme Iter (fusion nucléaire).

l'impact

- Recoller au peloton de tête des pays champions du calcul intensif. - Rendre la France plus attractive pour les chercheurs. - Étudier des problèmes encore inabordables à ce jour. - Faire migrer les grands codes comme ceux de la météo vers le massivement parallèle. - Générer des revenus et diffuser une expertise auprès de la recherche publique comme privée. - Renforcer la coopération scientifique entre la France et l'Allemagne, leaders européens du calcul intensif.

UNE ARCHITECTURE HYBRIDE

Ce sont deux machines en une. La première machine (SMP, pour Symmetric MultiProcessor) compte 8 racks Power 6 et atteint 68 téraflops. Elle ne dispose "que" de 3 584 processeurs, mais cadencés à 4,7 GHz. Elle supportera les applications existantes, en particulier les calculs climatologiques qui tournaient jusqu'alors sur les supercalculateurs vectoriels de NEC. Cette machine fonctionne sous le système d'exploitation IBM AIX. La seconde machine (MPP, pour Massive Parallel Processing) est une BlueGene/P, dernière-née d'IBM, qui compte 40 480 processeurs cadencés à 800 MHz et peut atteindre 139 téraflops. Elle tourne sous Linux. Les deux systèmes communiquent via le système de fichiers General Parallel File System d'IBM, se partageant ainsi 800 téraoctets de données de calcul.

COÛT25 MILLIONS

dont quatre ans de support, financés sur fonds propres du CNRS.

vous lisez un article d'Industries & Technologies N°0896

Découvrir les articles de ce numéro Consultez les archives 2008 d'Industries & Technologies

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

Simulation de la propagation d'une pandémie

Simulation de la propagation d'une pandémie

- Le Los Alamos National Laboratory fait tourner un modèle prédictif à grande échelle de pandémie du virus aviaire.Le Los Alamos National Laboratory[…]

01/06/2006 | CALCUL INTENSIFR & D
Un supercalculateur surpuissant et... économe

Un supercalculateur surpuissant et... économe

Plus d'articles