Nous suivre Industrie Techno

Valorisez vos données avec un moteur de recherche

ANTOINE CAPPELLE redaction@industrie-technologies.com

Sujets relatifs :

,
Avec l'augmentation de la quantité de données, les moteurs de recherche prennent de l'importance en entreprise. Ils vont aujourd'hui au-delà de leur rôle premier de recherche. Ils accèdent à l'information sous toutes ses formes, structurée ou non, et en font émerger le sens à travers des résultats organisés. Ils servent ainsi de base à d'autres applications, qu'ils alimentent en données.

Fichiers clients, factures, gestion des stocks, messageries... Les entreprises ont de plus en plus d'informations à gérer, stockées dans des silos variés. Entre une base de données parfaitement structurée et un texte rédigé, tous les documents stockés ne peuvent être exploités de la même façon. « On y accède généralement par la petite lucarne, en utilisant l'application d'origine », constate Olivier Astier, directeur de projet chez Exalead, fournisseur de moteur de recherche éponyme. Effectuer des recherches dans les différents silos prend du temps, et nécessite souvent de maîtriser le langage particulier des différentes applications. Des moteurs de recherche d'entreprise peuvent fournir aujourd'hui des résultats exhaustifs et organisés à partir de toutes les sources à disposition. Les applications se batissent autour de ces outils, à destination de tous les métiers, afin d'exploiter au mieux la valeur des données de l'entreprise.

Zoom sur ces outils qui autorisent la gestion transverse des données d'une entreprise.

1Identifier les données

« Que voudriez-vous faire que vous ne pouvez pas encore faire ? » C'est, pour Renaud Finaz, directeur marketing de la société de conseil Micropole, la première question à se poser. « Chaque entreprise a des problèmes de nature différente : il n'y a pas de solution clés en main », précise Olivier Astier. Une fois le besoin cerné, il faut définir quelles informations sont pertinentes, et comment en démultiplier la valeur. Par exemple en les rendant accessibles à des personnes qui ne pouvaient pas les consulter.

Chaque source d'information est de nature différente. Certaines sont structurées, en tableaux, par exemple. Mais la plupart ne le sont pas : les contrats, les e-mails, les fichiers de traitement de texte, ou les pages Web. Chaque type de données nécessite un connecteur spécifique pour être relié au moteur de recherche. Beaucoup sont standard, quand il s'agit de formats ou d'applications répandus. Il arrive que certains doivent être développés spécifiquement pour une entreprise. Mais les fournisseurs de moteurs disposent de plusieurs centaines de connecteurs, et étoffent leur liste au fur et à mesure des chantiers.

2 Installer le moteur de recherche

Une fois connectés, tous les silos seront indexés par le moteur de recherche, tous les jours ou toutes les minutes, selon les besoins dictés par les applications qui l'utiliseront.

Si l'étape de définition des besoins ne dure que quelques jours. L'installation en elle-même peut durer de quelques semaines à quelques mois. « Elle peut être réalisée avec le directeur informatique, directement avec les gens du métier, ou avec des intégrateurs partenaires : nous nous adaptons à la façon de fonctionner de l'entreprise », explique Olivier Astier.

La façon de travailler avec le fournisseur du moteur peut être un critère de choix. C'est l'un de ceux qu'a retenu Lyreco, distributeur de fournitures de bureau : « Nous souhaitions une mise en oeuvre efficace et rapide, et la possibilité de nous approprier la technologie pour en garder la maîtrise. Notre choix s'est porté sur Autonomy, qui a formé nos techniciens lors de l'installation », raconte le DSI Éric Jacqmart.

D'un point de vue matériel, le moteur s'installe sur de petits serveurs. Le nombre dépend du trafic et de la quantité de données à indexer, et peut varier de 1 à 50. L'application pourra être redimensionnée à tout moment, en ajoutant simplement de nouveaux serveurs.

3 Rechercher et exploiter

« Pour rechercher de l'information dans des bases de données, il faut souvent être formé et connaître des langages spécifiques. Les outils du Web, en revanche, ne nécessitent aucune formation », observe Renaud Finaz. C'est cette simplicité du Web que veulent importer dans les entreprises les applications actuelles basées sur des moteurs de recherche. Un seul champ suffit pour taper une requête : l'outil est intuitif, plus besoin de connaître la forme de l'information recherchée. La réponse rend compte d'un sujet de façon exhaustive en couvrant toutes les sources indexées.

Les résultats ne seront pas une simple liste. Ces applications sont capables de donner un sens à l'ensemble. « En utilisant des probabilités et des statistiques, en analysant la co-occurrence des mots, le moteur est capable de comprendre les sens différents d'un mot selon le contexte », explique Emmanuel Mériot, directeur général France de l'éditeur Autonomy. Donner du sens pour obtenir des résultats pertinents nécessite un bon paramétrage. C'est aussi un axe important de recherche et développement pour ces logiciels.

Les informations trouvées sont classées, et éventuellement traitées sous forme de courbes ou de tableaux. Elles peuvent être directement envoyées à une application, ou même une machine. Toute exploitation est imaginable. « Les entreprises vont créer, elles-mêmes ou avec des développeurs, les applications spécifiques à leur métier », explique Alexandre Bilger, PDG de Sinequa, éditeur de moteurs de recherche. Il peut s'agir de retrouver de façon structurée l'ensemble des données au sujet d'un client, en réunissant les contrats et les e-mails le concernant. Ou connaître la répartition des livraisons d'un produit en fonction de ses caractéristiques.

Le site rueducommerce.com est un client de Sinequa : le moteur de recherche est devenu l'élément central de ce site d'e-commerce, à la fois pour les clients et pour l'entreprise. « Le moteur aide à construire des guides d'achat ou des pages de sélection d'articles autour d'un thème, en faisant remonter des informations pertinentes », détaille Yannick Simon, le directeur général adjoint. « Bien utiliser un moteur de recherche est un problème mi-technologique, mi-humain : il faut bien s'approprier l'outil. »

4 Faire collaborer différents métiers

Les outils collaboratifs sont une application de plus en plus fréquente pour les moteurs de recherche. Ces derniers facilitent l'exploitation des bases de connaissances constituées pour différents métiers. « Si quelqu'un se pose une question sur un sujet, il peut facilement trouver des documents en tous genres, des commentaires et discussions qui s'y rapportent », décrit Philippe Lionne, PDG de l'intégrateur CYO. C'est également un moyen de rechercher des experts en fonction des projets auxquels ils ont collaboré ou des documents qu'ils ont rédigés.

Les sources multimédia trouvent leur place dans différentes applications : messages vocaux, images ou vidéos. Un système qui peut se décliner de la messagerie améliorée à la plate-forme collaborative de recherche et développement, en passant par un outil de formation. Quand toutes les informations d'une entreprise deviennent accessibles simplement par un même canal, il ne reste qu'à trouver comment en faire le meilleur usage.

80 %

C'est, selon l'Aproged, l'ordre de grandeur de la quantité d'information non-structurée que l'on trouve dans une entreprise.

Le client connaît la disponibilité locale de nos produits

ERIC JACQMART DIRECTEUR DU SYSTÈME D'INFORMATION DE LYRECO

« Notre moteur de recherche, destiné à nos clients, sert à trouver nos produits via notre site Internet. Il est connecté à notre ERP, qui contient les informations sur nos produits, nos stocks, et nos clients. L'application est ainsi capable de connaître la disponibilité locale des produits, et de ne retourner que des réponses correspondant au périmètre d'activité du client. Pour choisir le logiciel, nous avons demandé des démonstrations de faisabilité ou prototypes à plusieurs éditeurs. Notre choix s'est porté sur Autonomy, qui correspondait à nos attentes et proposait un service complet. L'entreprise a élaboré une architecture spécifique à nos besoins. Elle assure une maintenance annuelle dans le cadre de son contrat, mais nous effectuons nous-mêmes la gestion quotidienne du moteur. »

Le multimédia trouve sa place

Photos, sons, vidéos : ces documents se trouvent de plus en plus fréquemment dans les entreprises. Les moteurs de recherche actuels sont capables de prendre en compte les contenus de cette nature. Dans une image, il est possible de faire de la reconnaissance de caractères. Les documents écrits, scannés et enregistrés dans ce type de formats sont souvent nombreux. D'autres éléments peuvent être détectés, comme un logo, ou une couleur. En audio et vidéo, les paroles sont extraites par reconnaissance vocale. Le moteur renvoie ainsi vers la partie précise du document où est évoqué le sujet de la requête. Ce principe peut même être utilisé en temps réel : en analysant les propos d'un téléopérateur, une application peut lui proposer des informations en rapport avec sa conversation.

LES PRINCIPAUX ACTEURS

Exalead de la société française éponyme. Il est associé à Mashup Builder, une application pour organiser facilement les résultats. Idol de la société anglaise Autonomy. Il sert de base à des applications capables de détecter le sens des données. Et aussi Sinequa, Antidot, Endeca... ainsi que des logiciels open-source Solr de Lucene.

LEUR TARIFICATION

Elle dépend du nombre de connecteurs requis, d'utilisateurs, de fonctionnalités choisies... Exalead propose une tarification adaptée aux petits projets. L'installation elle-même est un service dont le prix dépend de la durée du chantier. Le contrat de licence inclut la maintenance et les mises à jours du logiciel. Certains éditeurs, comme Autonomy, proposent également une utilisation en mode cloud.

vous lisez un article d'Industries & Technologies N°0934

Découvrir les articles de ce numéro Consultez les archives 2011 d'Industries & Technologies

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

Faites de l'or avec les données

Faites de l'or avec les données

La démarche d'open data, qui consiste à rendre accessibles des données variées, a été initiée par les administrations. Elle représente une opportunité[…]

01/11/2012 | EXPÉRIENCES
PFW Aerospace allège l'A 350 XWB

PFW Aerospace allège l'A 350 XWB

Virbac passe à la désinfection aérienne

Virbac passe à la désinfection aérienne

ISO 50 001 : pilotez vos performances énergétiques

ISO 50 001 : pilotez vos performances énergétiques

Plus d'articles