Nous suivre Industrie Techno

En 2013, faites parler vos données

MATHIEU BRISOU
La multiplication des sources d'information entraîne des coûts de stockage et de traitement pour les industriels. Cependant, ce déluge de données est également une source de profit. L'analyse sémantique permet d'en exploiter le potentiel.

Collecter, hiérarchiser et analyser des informations de manière automatique : l'enjeu est de taille pour les industriels, confrontés à des volumes croissants de données. Pour tirer parti de ces « big data », ils sont de plus en plus nombreux à s'intéresser aux outils d'analyse sémantique. De plus en plus utilisées par les moteurs de recherche, ces technologies reposent sur l'établissement de relations entre des signes (des mots ou des notions, par exemple) et leurs référents (ce qu'ils induisent). Certaines méthodes permettant ce type d'analyse requièrent une sorte de dictionnaire codifiant les relations entre termes et sens. Une approche décrite dès 2001 par l'inventeur du Web, Tim Berners -Lee, qui avait détaillé comment structurer les informations en combinant le langage de balisage XML (Extensible markup language) et le langage de description des ressources Web et des métadonnées associées RDF (Ressource description framework).

Des outils pour exploiter les données non structurées

Le monde de l'entreprise n'a pas tardé à s'emparer du sujet, avec la création du PMML (Predictive model markup language), créé pour faciliter l'exploitation de données, puis le lancement par IBM de l'UIMA (Unstructured information management architecture). Devenu depuis un standard international régulièrement mis à jour par des communautés open source, cet ensemble d'outils logiciels facilite l'analyse de données non structurées de toute nature, comme du texte, des vidéos ou du son.

De leur côté, des éditeurs « généralistes » comme Oracle, SAP ou encore IBM, ainsi que des spécialistes comme Arisem, lié à Thales, ou Sinequa proposent leurs solutions, à la croisée de l'informatique décisionnelle et de la gestion électronique des documents. Les adopter est payant. Exemple : Siemens utilise les outils de Sinequa pour faciliter la recherche d'informations de ses services de R&D. L'éditeur souligne que le système « Technosearch », accessible à environ 20 000 employés, a permis de diminuer de 25 à 30 % le temps consacré à la recherche d'informations par les personnels de R&D qui l'utilisent !

Le langage XML permet d'introduire des informations sémantiques à l'aide de balises prédéfinies (tags) exploitables par une machine. Ces tags sont rarement renseignés par les auteurs. Il peut alors être pertinent de les extraire automatiquement. « Cela permet d'analyser des informations éparses issues de notices techniques, d'argumentaires commerciaux ou d'avis variés », explique Claude de Loupy, dirigeant et co-fondateur de Syllabs. « En collectant et croisant ces données de manière sémantique, il est possible de réaliser des publications, d'analyser la perception de marques ou de produits, ou de deviner l'apparition de nouvelles tendances. »

L'approche métier de l'analyse sémantique se développe

Dans le contexte d'une utilisation industrielle, on peut même aller plus loin. « Dans l'industrie, ce sont les utilisateurs et non les auteurs qui annotent les contenus », explique François Bourdoncle, co-fondateur et directeur technique d'Exalead - société rachetée en juin 2010 par Dassault Systèmes et spécialisée dans les outils de recherche liés à l'analyse sémantique. « Cette approche, qui consiste à plaquer une structure sémantique métier sur des données, est émergente. Mais elle donne déjà des résultats dans certains secteurs, comme l'industrie pharmaceutique. » La solution Luxid de Temis est ainsi utilisée par Sanofi-Aventis et Life Biosystems, pour relier des cas cliniques à des mécanismes moléculaires.

Pour généraliser cette approche « métier », les éditeurs cherchent à tirer à la baisse le coût d'élaboration des corpus. « L'analyse sémantique des données relève de la haute couture, surtout si l'on considère des flux de données (internes, externes ou disponibles au sein d'une entreprise étendue) qu'il faut coupler », relève David Roussel, responsable de la veille technologique chez EADS. Exalead détient peut-être la parade. L'éditeur de logiciels parie sur le « machine learning » : à l'aide de méthodes statistiques, l'ordinateur construit, à partir d'un volume minimal d'informations, un corpus évolutif dans le temps. Une automatisation qui reviendrait à passer du sur-mesure au prêt-à-porter. c

TOUT CE QUE L'ANALYSE SÉMANTIQUE PEUT FAIRE POUR VOUS

Optimiser l'utilisation de vos produits Pour déterminer le meilleur positionnement pour ses éoliennes, afin de maximiser la production énergétique, Vestas a compilé diverses données dont des enregistrements météorologiques, des images satellites et des informations géospatiales à l'aide d'outils d'IBM. Mieux gérer votre logistique Le groupe Gefco a adopté un outil d'Exalead pour suivre en temps réel la position de ses véhicules. Innover Les outils d'analyse sémantique Luxid de Temis sont utilisés dans l'industrie pharmaceutique pour croiser les données sur les molécules et leurs effets secondaires, afin de suggérer le test de molécules ayant des effets secondaires proches de ceux des candidates pour une indication donnée. Surveiller votre réputation Pour analyser les réponses fournies par les pharmaciens sur leurs attentes, Sanofi Pasteur MSD a confié à Owi Technologies le soin d'analyser les questionnaires recueillis. Vous aider à comprendre des textes réglementaires Très codifiée, la structure des textes de lois se prête bien à l'analyse sémantique. Le portail Lexis360 de la société LexisNexis détecte ainsi le contexte d'une requête liée au droit et propose à l'utilisateur de l'élargir ou de la recentrer.

Siemens indexe ses recherches

Avec des équipes réparties dans le monde entier, Siemens a intérêt à peaufiner l'échange d'informations sur ses résultats de R&D. Le groupe s'est équipé d'un moteur de recherche adapté. LE PROBLÈME LE PHÉNOMÈNE DE BIG DATA À L'ÉCHELLE D'UN GROUPE MONDIAL Comment surferions-nous sur le Web sans Google ? Laborieusement et à vitesse réduite... Or il n'existe pas d'équivalent universel de ce moteur de recherche capable de s'attaquer aux données structurées ou non structurées de l'entreprise. Pour permettre aux employés de sa R&D, répartis partout dans le monde, d'accéder à une information régulièrement mise à jour sur les autres programmes de recherche menés au sein du groupe et d'identifier des noms d'experts associés à ces travaux, Siemens souhaitait se doter d'un outil adapté. LA SOLUTION UN MOTEUR DE RECHERCHE SÉMANTIQUE Après des tests portant sur une sélection de sources au sein de l'entreprise, ce sont les algorithmes de la société française Sinequa qui ont convaincu les professionnels du groupe Siemens. Reposant sur une architecture qui autorise l'adaptation de la capacité de calcul au besoin par simple augmentation du nombre de serveurs, sans impact sur la pertinence des résultats obtenus, le moteur de recherche mise sur des outils sémantiques pour repérer les noms d'experts. Il est capable de traiter plus de 100 millions de documents, soit mille fois plus que la plupart de ses concurrents. LE RÉSULTAT UN GAIN DE PRODUCTIVITÉ Selon une étude menée en interne par Siemens auprès de 250 collaborateurs, le temps consacré à la recherche d'informations a été réduit de 25 à 30 %. L'intégration de cette solution contribue en outre à l'efficacité de la R&D du groupe, en évitant le risque de développer une technologie déjà conçue. Le périmètre des recherches a même été élargi aux universités travaillant en collaboration avec le groupe. Le moteur devrait prochainement être utilisé par des professionnels de Siemens hors R&D. cm MURIEL DE VERICOURT

SIEMENS

Spécialisé dans les hautes technologies, le groupe d'origine allemande Siemens, présent dans la santé, l'énergie et l'industrie, emploie 40 000 personnes dans le monde pour sa R&D.

vous lisez un article d'Industries & Technologies N°0950

Découvrir les articles de ce numéro Consultez les archives 2012 d'Industries & Technologies

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

[Pas à pas] Comment tirer parti de la réalité augmentée dans votre usine

[Pas à pas] Comment tirer parti de la réalité augmentée dans votre usine

Profitant des formidables progrès de l'informatique embarquée et de l'essor de l'usine 4.0, les exemples d'applications[…]

Bâtiments intelligents : des économies du sol au plafond

Bâtiments intelligents : des économies du sol au plafond

INNOVATION À TOUS LES ÉTAGES

Dossiers

INNOVATION À TOUS LES ÉTAGES

« Bâtiments intelligents : il faut placer l'utilisateur au centre », Olivier Cottet, Schneider Electric

Interview

« Bâtiments intelligents : il faut placer l'utilisateur au centre », Olivier Cottet, Schneider Electric

Plus d'articles