Nous suivre Industrie Techno

Le big data aux manettes

Le big data aux manettes

© dr

Déjà producteurs de grandes quantités de données, les acteurs du secteur devront apprendre à les extraire, les visualiser et les analyser pour rester compétitifs. Un triple défi technologique, qui peut être relevé en misant sur les progrès de la science des algorithmes, la généralisation des technologies du cloud, et l'émergence de moteurs de classement et d'analyse comme Hadoop.

Un Everest de données... c'est la façon dont l'industrie aéronautique voit le big data. Les avions et leurs centaines de milliers de composants sont de fait des « objets » de plus en plus connectés. Un turboréacteur émet plusieurs téraoctets de données au cours d'un vol ! Les capteurs sont notamment disséminés dans le fuselage, les pompes hydrauliques ou l'avionique. Mais les échelles changent : « Il va falloir passer au yottaoctet, soit 1 000 milliards de téraoctets », prévient Fabrice Bourdeix, vice-président stratégie, division systèmes d'information et de communications sécurisés de Thales.

Paradoxalement, l'industrie aéronautique, pourtant à la pointe en matière d'innovations, a mis un peu de temps à s'y atteler. Airbus entame tout juste une démarche coordonnée à l'échelle du groupe sur le big data, même si certaines de ses filiales ont avancé sur le sujet. L'avionneur vient d'ailleurs d'annoncer, s'être doté d'un « monsieur digital », en la personne de Frédéric Sutter, directeur du programme de la digitalisation du groupe. Safran vient, de son côté, de créer une entité chargée de coordonner la gestion massive des données, Safran Analytics. Chez Air France KLM, qui a une vraie problématique dans la maintenance des avions et le fret, le programme big data n'a été lancé qu'en novembre 2014, sous la direction de David Huck. « Dès que l'un de nos avions se pose, il se connecte à notre réseau Wi-Fi et émet des séries de données sur tous ses systèmes », détaille l'intéressé. Certains ont toutefois pris une petite avance, comme Thales. « Nous avons une force de frappe potentielle de 10 000 ingénieurs dédiés au digital et de 80 data scientists en France », annonce Fabrice Bourdeix.

« Le big data touche aujourd'hui tout le monde, y compris les PME, dans tous les domaines où les calculs sont importants », analyse Yannick Lejeune, directeur Internet du groupe Ionis. Maintenance prédictive, essais en vol, lean manufacturing, gestion du trafic aérien : les applications sont multiples. La science des algorithmes, la généralisation des technologies du cloud, et l'émergence de moteurs de classement et d'analyse comme Hadoop mettent désormais à la disposition des industriels une variété d'outils à faible coût. Par exemple, le système de cartographie du ciel Gaia (3 petaoctets de données à stocker) utilise une plate-forme Hadoop qui coûte cinq fois moins cher qu'une base de données relationnelle classique. « Dans le domaine de la maintenance, l'alliance entre le big data et la fabrication additive va constituer une rupture majeure », pronostique Massi Begous, directeur associé chargé du secteur aéronautique au sein du cabinet Roland Berger. À condition de relever les trois défis du big data : extraire, visualiser et analyser.

 

1. Extraire

 

Dans le magma des téraoctets et yottaoctets dénicher les données utiles est évidemment la première étape indispensable. « Le big data, c'est comme chercher un aiguille dans une botte de foin », résume Fabrice Bourdeix de Thales. L'un des fondements de cette science est de chercher les anomalies, ou « signaux faibles », en jargon big data. Par exemple, dans une application développée par Thales dans le domaine du contrôle des passagers dans un aéroport, les algorithmes développés par la firme française utilisent plusieurs sources d'informations : le « Passenger main record » (PMR), un document recueilli par les compagnies aériennes lors de l'achat du billet qui comporte 19 champs, ou encore différentes bases de données étatiques (dont des données biométriques, par exemple). « En croisant tout cela, on va extraire ce qui sort de la normalité, afin de repérer un individu potentiellement dangereux. Toutefois, nous le faisons sans paramétrer a priori ce qu'est la « normalité ». Faute de quoi, ces personnes pourraient un jour ou l'autre découvrir nos paramètres », précise Pascal Zenoni, responsable du projet.

Par ailleurs, il faut bien veiller à la robustesse et à l'origine des données. Avec toutes les implications juridiques que cela entraîne. En effet, une donnée a souvent un propriétaire. Avant de l'utiliser, il faut donc être certain qu'elle est libre d'accès, ou que l'on dispose de l'autorisation de s'en servir. « Nous nous posons la question de savoir si les données sont la propriété du groupe Safran ou celle de notre client », précise ainsi Ghislaine Doukhan, directrice de Safran Analytics. Par ailleurs, il faut vérifier l'intégrité des fichiers, la façon dont les données ont été récoltées, la fréquence à laquelle cela a été fait (ou au contraire le caractère ponctuel du recueil), et la nature des capteurs utilisés. « C'est extrêmement important, pour être sûr de retrouver facilement les données lorsqu'il faudra les analyser », souligne Emmanuel Noirhomme, responsable des opérations au sein de la jeune socitété Redbird, qui propose de recueillir des images à l'aide de petits drones. La quantité de données recueillies (100 gigaoctets par mission) a conduit Redbird à industrialiser son activité big data. Redbird emploie ainsi près de vingt-cinq ingénieurs pour développer ses propres algorithmes, et travaille avec le cloud d'Amazon pour les faire tourner.

 

2. Visualiser

 

« L'un des points importants dans le big data est de mettre à disposition du client la bonne information très rapidement », résume Emmanuel Noirhomme. Redbird, par exemple, amasse des images permettant de détecter une fuite sur un gazoduc, ou de contrôler une ligne à haute tension, en surveillant la progression de la végétation. La visualisation de ces images dépend étroitement de l'efficacité des algorithmes et permet de concrétiser la donnée pour l'utilisateur. Dans le domaine de la cybersécurité, stratégique pour l'aéronautique, Thales a développé un outil de visualisation sous forme d'une cartographie complète d'un système informatique, pour repérer les machines infectées et la provenance de l'anomalie. Ce logiciel, Tulip, a été conçu et adapté à la cybersécurité avec le Laboratoire bordelais de recherche informatique (Labri).

Des outils open source, interfaçables avec Hadoop, existent. Par exemple, les librairies d'affichage R et Python sont de plus en plus utilisées pour créer des graphes, ou des tableaux très simples d'utilisation. En matière de maintenance prédictive, pour une bonne visualisation des précurseurs de panne, le groupe Air France va utiliser des symbologies rouge ou vert et réaliser une cartographie de l'avion.

 

3. Analyser

 

Aussi importante que l'extraction des données, il y a l'étape de l'analyse. Les nouveaux outils du big data en sont devenus l'alpha et l'omega. Trop souvent, par souci d'économie, les entreprises écrasent leurs fichiers pour faire place nette. Or dans le big data, la notion d'historique est fondamentale pour repérer les fameux signaux faibles. « Pour détecter un précurseur de panne sur une pompe hydraulique, par exemple, il nous faudra un historique complet de l'avion. Sinon, l'algorithme ne pourra pas allumer l'alerte », insiste David Huck.

L'outil de stockage et d'analyse Hadoop, disponible en open source avec sa version 2, s'est imposé comme un standard dans le big data pour toute l'industrie, aéronautique comprise. Fonctionnant sur des clusters de serveurs décentralisés, Hadoop permet de traiter plusieurs téraoctets de données en quelques minutes. En revanche, à l'échelle des petaoctets, il faut plutôt compter plusieurs heures. Pour une rapidité nettement supérieure, le framework Spark, plus récent et donc moins mature, est capable d'effectuer des calculs en quasi temps réel. Il fonctionne en interface avec Hadoop, mais en mode streaming (en continu), alors qu'Hadoop fonctionne en mode batch (par lots). Spark semble donc plus adapté pour les requêtes répétitives de données, alors que Hadoop est parfait pour les requêtes aléatoires. « En fait, ces deux outils sont complémentaires », estime David Huck. Car au final, ce qui compte ce n'est pas seulement d'alerter, mais également d'apporter des mesures correctives.

ITWEB VidéoPour mettre à niveau ses connaissances

C'est un des rendez-vous incontournables pour qui veut actualiser ses connaissances sur le traitement massif des données. Lors des conférences Strata + Hadoop, on parle outils, technologies et nouvelles architectures du big data. Celles qui ont été organisées en 2014 ont été enregistrées en vidéo. La prochaine conférence aura lieu à New York, du 29 septembre au 1er octobre 2015. L'organisateur, O'Reilly Media Inc, propose aussi des cycles de conférences sur la vélocité et les logiciels open source.

Petits drones, gros fichiers

cLa gestion des données est au coeur du métier de certains dronistes, qui captent au cours de leurs missions différentes informations pour les restituer sous un format directement utilisable par leurs clients. Airinov analyse ainsi les besoins agronomiques (azote par exemple) des terres agricoles en mesurant la lumière réfléchie par le couvert végétal dans quatre bandes distinctes. Studiofly utilise plusieurs technologies, dont des photographies haute résolution pour réaliser des modélisations 3D texturées, ou encore la thermographie pour établir un diagnostic thermique de bâtiments, ou surveiller des installations électriques. Redbird propose également des missions de surveillance de lignes à haute tension, ou encore de carrières ou de mines. « 80 % de nos ingénieurs sont spécialisés dans les datas », annonce Emmanuel Noirhomme, cofondateur de Redbird et responsable des opérations. En trois ans d'existence, la PME a déjà réalisé plus de 500 missions, en accumulant à chaque fois environ 100 gigas de données.

vous lisez un article d'Industries & Technologies N°0977

Découvrir les articles de ce numéro Consultez les archives 2015 d'Industries & Technologies

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

Bateau météo, supercalculateur, fibre optique spatiale… les innovations qui (re)donnent le sourire

Bateau météo, supercalculateur, fibre optique spatiale… les innovations qui (re)donnent le sourire

Difficile de trouver la motivation en ce début de semaine ? Voici une petite sélection d’innovations qui pourraient vous aider[…]

11/02/2019 | TélécomsNaval
IMT Mines Alès veut accélérer l'innovation à Toulouse et ailleurs

IMT Mines Alès veut accélérer l'innovation à Toulouse et ailleurs

Cybersécurité, laboratoire de robotique, éolienne… les meilleures innovations de la semaine

Cybersécurité, laboratoire de robotique, éolienne… les meilleures innovations de la semaine

Avion supersonique, plateforme dédiée à l'IA, drone hybride... les meilleures innovations de la semaine

Avion supersonique, plateforme dédiée à l'IA, drone hybride... les meilleures innovations de la semaine

Plus d'articles