Nous suivre Industrie Techno

Le CNRS offre le deuxième supercalculateur européen à la recherche française

Industrie et  Technologies
L'institution se dote d'une plate-forme de calcul intensif d'une puissance crête de 207 Teraflops qui sera mise à la disposition de l'ensemble de la recherche civile française. Elle multiplie ainsi la puissance disponible par un facteur 30.


« Nous devons rattraper notre retard dans le domaine du calcul scientifique », a estimé Valérie Pécresse, ministre de l'Enseignement supérieur et de la Recherche, ministère de tutelle du Centre National de la Recherche Scientifique (CNRS), hier lors de l'annonce de la signature d'un contrat de 25 millions d'euros sur 4 ans entre cette entité et IBM France pour la fourniture d'une plate-forme de calcul intensif d'une puissance crête de 207 Teraflops et des services associés. Pour mémoire 1 Teraflops = Mille milliards de FLOPS (FLoating point Operations Per Second) ou d'opérations en virgule flottante par seconde.

Cette toute nouvelle puissance de calcul permettra d'aborder des problèmes scientifiques de plus en plus complexes. Par exemple, en matière de recherches sur le climat, répondre aux questions que pose le réchauffement climatique dépend de l'accès à des moyens de calcul intensif. Ceux-ci permettront par exemple de quantifier la probabilité d'événements extrêmes ou d'étudier les impacts sur les écosystèmes.

La chimie est aussi un des domaines utilisateur du calcul intensif, que ce soit pour des applications industrielles ou des enjeux de société. Ainsi, la combustion dans l'air des hydrocarbures usuels fait intervenir plusieurs centaines d'espèces chimiques et quelques milliers de réactions élémentaires. Une augmentation d'un facteur 100 de la puissance de calcul devrait permettre de mieux comprendre et contrôler ces mécanismes. On pourra alors aborder l'utilisation optimisée des biocarburants ou encore la minimisation de formation des suies.

La biologie est un domaine en émergence dans le domaine du calcul scientifique, en particulier en ce qui concerne la compréhension de mécanismes réactionnels, l'ingénierie des interactions protéine-ligand, le repliement de protéines et de façon générale la simulation de la complexité du vivant, jusqu'aux cellules, aux organes ou aux écosystèmes.

« De fait, cette plate-forme sera accessible à toute la communauté scientifique et des synergies seront mises en place avec l'Institut des grilles (grid computing) qui a été inauguré mi-décembre » a précisé Catherine Bréchignac, présidente du CNRS.

Avec cette nouvelle plate-forme qui sera implantée à l'IDRIS, son centre national de calcul situé à Orsay, le CNRS entend satisfaire deux problématiques : répondre à très court terme aux besoins de calcul les plus urgents ; préparer l'arrivée à moyen terme d'architectures capables de délivrer des Petaflops.

La nécessité de soutenir un très large spectre de projets de recherches d'avant-garde a conduit le CNRS à choisir une architecture scalaire polyvalente et hétérogène, résultant de l'intégration de deux architectures d'ordinateurs différentes mais complémentaires :

  • - Une architecture massivement parallèle appelée MPP (Massive Parallel Processing) adaptée aux applications pouvant bénéficier d'un niveau de parallélisme "extrême". Elle est donc optimisée pour ce type d'application, par exemple par la mise en œuvre d'un réseau d'interconnexions entre processeurs (utilisé pour échanger des informations entre les unités de calcul) pouvant soutenir sans faiblir des communications engageant des dizaines de milliers de processeurs simultanément.
  • - Une architecture plus généraliste appelée SMP (Symmetric Multi Processor) pour les applications à parallélisme modéré, destinée à assurer la relève de la plate-forme IBM Power4 Zahir actuellement en exploitation à l'IDRIS. Cette plate-forme permet à des ensembles de 32 processeurs de calcul de partager une très grosse mémoire.



Le système IBM Power 6, d'une puissance nominale de 68 Teraflops, sera destiné au support des applications existantes aujourd'hui à l'IDRIS, dont la plus grande partie possède un niveau de parallélisme intermédiaire à gros grain (typiquement, s'exécutant sur des petites centaines de processeurs) ou bien utilise un modèle de programmation parallèle à mémoire partagée sur 32 processeurs. Cette composante étant au mois 10 fois plus performante que la plate-forme actuelle il va de soi qu'elle va entraîner une évolution qualitative et quantitative des simulations en cours actuellement.

Le système BlueGene/P, d'une puissance nominale de 139 Teraflops, est de nature plus prospective, car il n'existe pas actuellement en France une plate-forme massivement parallèle pour la recherche académique. Il est destiné à entraîner la communauté scientifique nationale dans le développement, le déploiement et l'exploitation des applications à fort parallélisme massif s'exécutant sur des milliers, voire des dizaines de milliers de processeurs. Cette évolution est incontournable pour accéder à des niveaux de performance au-delà du Petaflop, nécessaires pour les grands défis scientifiques actuels.

Cet investissement sera aussi écologique, car le système Blue Gene/P et Power 6 présenterait selon IBM le rapport consommation d'énergie/puissance fournie le plus bas du marché actuellement.

Les deux composantes de la nouvelle plate-forme de calcul n'incorporent pas les mêmes éléments matériels (processeurs, mémoire, disques) ni le même système d'exploitation (Linux pour MPP, IBM AIX pour SMP). Mais l'intégration en une seule plate-forme de calcul à image unique pour les scientifiques qui lui confieront leurs simulations numériques se fait par :


  • - La disponibilité d'un système de fichiers global de haute performance, permettant une gestion unifiée des données, partagé par les deux composantes. Les utilisateurs voient un seul système de fichiers, qui est accédé par chaque composante. Cela permet une bien meilleure gestion des données pour les utilisateurs qui mettent en œuvre les deux plates-formes.
  • - La disponibilité d'un système unifié de soumission et de gestion des travaux.

Le rôle de la composante Power 6

L'IDRIS exploite depuis 2003 une plate-forme IBM Power 4 - architecture SMP - comportant 1024 processeurs de calcul, avec une puissance de calcul crête de 6,7 Teraflops. L'architecture de la nouvelle plate-forme Power 6 est la même, avec néanmoins un nombre important d'améliorations et de raffinements qui conduisent à des processeurs de calcul en moyenne quatre fois plus puissants que les processeurs actuels. Comme le nombre de processeurs est multiplié par trois, l'augmentation de la puissance de calcul est un facteur de l'ordre de 10-12. La migration des applications du système actuel vers le nouveau système sera très simple pour les utilisateurs, puisque l'architecture et le système d'exploitation sont identiques.

Toutefois, le rôle de la composante SMP ne sera pas simplement d'assurer la continuité des applications existantes. L'augmentation très importante des ressources de calcul doit relancer les ambitions de la communauté scientifique, avec une forte évolution à la fois quantitative (simulations plus raffinées des problèmes actuels, donnant accès à des phénomènes nouveaux) et qualitative (problèmes nouveaux, portage de codes qui aujourd'hui ne s'exécutent pas sur une plate-forme SMP).

Les performances accrues des processeurs Power 6, ainsi que l'accès à une très grosse mémoire sont susceptibles d'attirer de nouvelles applications qui s'exécutent aujourd'hui sur d'autres architectures dans les secteurs de la recherche sur le climat et de la mécanique des fluides.

La livraison, installation et mise en service de cette composante est prévue pour l'été 2008. A cette date, elle prendra la relève de la plate-forme scalaire actuelle.

Le rôle de la composante BlueGene/P

L'architecture BlueGene/P est optimisée pour les applications à parallélisme massif, pouvant s'exécuter de manière performante sur des milliers, voire des dizaines de milliers, de processeurs. Pour cette raison, elle doit être considérée comme moins généraliste et plus spécialisée que la composante SMP. Un sous-ensemble des projets s'exécutant aujourd'hui sur les centres nationaux bénéficiera donc de l'accès à cette architecture.

L'absence jusqu'à ce jour d'une plate-forme massivement parallèle fait que la recherche publique en France, hors les applications de Défense, manque d'une expérience solide dans l'utilisation d'une telle plate-forme. L'IDRIS a déjà identifié un certain nombre de projets de l'ensemble de la communauté académique - notamment, dans le domaine de l'astrophysique et de l'océanographie - dont les codes possèdent un profil permettant une migration immédiate sur la plate-forme BlueGene/P. Pour le moyen et long terme, le service de Support aux Utilisateurs de l'IDRIS mettra en place dans les mois à venir un support extrêmement musclé au développement, à la migration et à l'optimisation des applications scientifiques sur BlueGene/P.

Bien que considérée comme une plate-forme spécialisée, l'expérience de ces deux dernières années aux USA et en Allemagne a montré que le spectre d'applications adaptées à cette architecture est plus large que prévu. Par applications adaptées, il faut entendre applications extensibles (scalables), c'est-à-dire les applications telles que, lorsqu'on double le nombre de processeurs qui interviennent dans l'exécution, le temps d'exécution se réduit de moitié. Ceci est une contrainte qui est loin d'être banale.

Il existe aujourd'hui un nombre important d'applications extensibles à des milliers, voire des dizaines de milliers de processeurs sur BlueGene/P, dans les domaines suivants :

  • ? Chromodynamique quantique ;
  • ? Transport turbulent dans un plasma confiné en tokamak (lié au projet ITER) ;
  • ? Modélisation du climat ;
  • ? Astrophysique ;
  • ? Relativité Générale (solution des équations d'Einstein) ;
  • ? Applications industrielles de la mécanique des fluides ;
  • ? Dynamique moléculaire ;
  • ? Chimie quantique ;
  • ? Physique des matériaux ;
  • ? Pétrole : étude des réservoirs ; sismographie ;
  • ? Finances.

Cette plate-forme sera installée fin janvier 2008, la mise en service étant prévue pour mars 2008.

Jean-François Prevéraud

Pour en savoir plus : http://www.cnrs.fr & http://www.ibm.com

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

[Exclusif] « La Fédération hospitalière de France planche sur un respirateur rapidement industrialisable », annonce Enguerrand Habran, son directeur de l'innovation

[Exclusif] « La Fédération hospitalière de France planche sur un respirateur rapidement industrialisable », annonce Enguerrand Habran, son directeur de l'innovation

Face à la pénurie de respirateurs artificiels qui guette les hôpitaux français, le Fonds de dotation de la[…]

25/03/2020 | SantéCovid-19
Hydrogène, batterie et moteur de fusée imprimé en 3D… les meilleures innovations de la semaine

Hydrogène, batterie et moteur de fusée imprimé en 3D… les meilleures innovations de la semaine

Avec Modalis², l’Ifpen veut développer la boîte à outils numériques des batteries du futur

Avec Modalis², l’Ifpen veut développer la boîte à outils numériques des batteries du futur

Pour bien commencer la semaine : Chez Renault, un jumeau numérique pour optimiser la production

Pour bien commencer la semaine : Chez Renault, un jumeau numérique pour optimiser la production

Plus d'articles