Nous suivre Industrie Techno

Faites de l'or avec les données

PHILIPPE RICHARD

Sujets relatifs :

,
Faites de l'or avec les données

Plus de 2 millions de téléchargements ont été effectués sur le portail américain Data.gov en 2011, contre 652 412 en 2010.

© D.R.

La démarche d'open data, qui consiste à rendre accessibles des données variées, a été initiée par les administrations. Elle représente une opportunité pour les entreprises, qui peuvent à leur tour jouer l'ouverture et le partage des informations pour se différencier, améliorer leur offre de services et se rendre plus visibles auprès de leurs clients.

Mettre à la disposition de tous des jeux de données numériques : c'est le principe de l'open data. Ce mouvement apparu en 1966 aux États-Unis avec la loi sur le libre accès à l'information a d'abord concerné les renseignements récoltés par les collectivités, notamment des bases géographiques ou statistiques, des textes réglementaires, des études ou des annuaires. Désormais, il inspire aussi des entreprises, qui choisissent de publier certaines informations produites dans le cadre de leur activité. Une mine d'or, pour qui sait l'exploiter. Voire un exemple à suivre : passer du statut d'exploitant à celui de producteur peut se révéler payant.

1. Évaluez le potentiel du gisement

Pour tirer parti des données disponibles, posez-vous d'abord les questions classiques avant tout lancement d'une nouvelle activité. À qui pourriez-vous apporter votre capacité d'innovation ? Dans l'écosystème de quelle entreprise pourriez-vous trouver votre place ? Qu'avez-vous à offrir ?

Pour l'instant, les informations publiées ont surtout été mises à profit par des développeurs, qui les ont essentiellement transformées en applications mobiles, notamment à la suite d'une série de concours à idées ciblant ce type de services. Une activité qui permet de gagner rapidement en visibilité. Avec Eo'City, un programme qui informe les Rennais des horaires de bus et de la disponibilité de places dans les parkings de la ville, la société NewLC a ainsi été primée d'une somme de 3 500 euros, qui n'a pas remboursé les quelque 20 000 euros qu'avait nécessité le développement. « En revanche, nous nous sommes fait connaître. Nous avons même signé un contrat. On peut donc considérer que le retour sur investissement est là », résume Éric Bustarret, fondateur de la société qui emploie huit personnes.

Quant aux entreprises spécialistes du e-commerce ou de la livraison, elles sont nombreuses à s'intéresser aux nomenclatures des voies et des adresses, qui figurent parmi les fichiers les plus téléchargés sur les plates-formes open data. Ces informations peuvent également être utilisées pour requalifier un fichier clients en fonction de critères géographiques.

Au-delà de ces créneaux particuliers, d'autres usages des données peuvent être envisagés, par exemple pour mieux comprendre les évolutions de votre secteur. C'est par exemple le choix qu'ont fait le groupe Poult, un producteur de biscuits sous marque de distributeurs basé à Toulouse, et certains de ses partenaires industriels non concurrents. Chacun a apporté sa contribution et a bénéficié en retour d'un riche ensemble d'informations.

2. Trouvez les filons porteurs

Dans ce cas précis, les parties prenantes ont été directement sollicitées et informées de la disponibilité de données susceptibles de les intéresser. Même si ce n'est pas votre cas, peut-être existe-t-il, parmi les informations déjà mises à la disposition du plus grand nombre, des renseignements pertinents pour votre activité.

Pour les cibler, vous pouvez procéder vous-même au repérage, en explorant les sites dédiés (voir encadré ci-contre) ou vous faire accompagner. « Aujourd'hui, seuls les grands groupes sont capables de s'offrir des analyses et des jeux de données souvent très chers et très riches. Notre offre va permettre aux PME, TPE, développeurs, indépendants d'acquérir des données aussi qualifiées et riches, mais à moindre coût, voire gratuitement », affirme François Bancilhon, fondateur de Data Publica, qui veut créer une place de marché des données.

3. Apprenez à extraire les pépites

Une fois les informations utiles repérées, penchez-vous sur les modalités de leur intégration. Car si l'open data consiste en principe à supprimer les contraintes techniques, juridiques et financières qui entravent la libre diffusion des données, il vous incombe toutefois de vérifier quels droits d'utilisation leur propriétaire accorde à des tiers. Vous devez évidemment vous plier à la législation, notamment en ce qui concerne l'enregistrement, la conservation et l'utilisation de données nominatives, encadrées par la loi informatique et liberté.

Enfin, des outils spécialisés peuvent vous aider à exploiter au mieux les éléments recueillis. Pour comprendre une série statistique ou établir une relation de cause à effet entre deux variables, des logiciels de visualisation comme les tableurs s'avèrent précieux. Mais ils ne sont pas toujours suffisants. Les outils d'infographie et de cartographie en ligne, comme ceux que propose la société française Mapize, sont efficaces pour rendre « visuellement compréhensibles » des informations.

4. Devenez producteur

L'idée d'une circulation fluide des données vous semble désormais naturelle ? Vous êtes prêt pour l'étape ultime : rendre publiques vos propres informations. Une démarche qui peut contribuer directement à l'accroissement de votre activité, comme les poids lourds de l'Internet l'ont bien compris. Plutôt que de chercher à vendre des applications mobiles, Amazon a par exemple ouvert dès 2005 ses bases de données de livres via une interface de programmation (API), à savoir des jeux de données ouverts aux programmateurs. Des professionnels et des amateurs affichent ainsi sur leur site ou leur blog des informations sur les livres. Les internautes intéressés sont redirigés vers Amazon et le revenu éventuellement généré est partagé entre le géant du e-commerce et le tiers.

L'ouverture de données peut également répondre à d'autres motivations, qu'il s'agisse de mieux comprendre l'environnement ou l'histoire de votre entreprise en ouvrant ses archives à des universitaires, d'améliorer son image ou encore d'éviter les usages sauvages. La RATP ou JC Decaux, ont ainsi rendu certaines informations publiques pour mettre fin à des réutilisations non autorisées.

Tout d'abord, il vous faudra sélectionner les données qui répondent aux objectifs que vous vous êtes fixés. Évidemment vous devez écarter les informations relevant de la vie privée et de la sécurité nationale et les informations présentes dans des documents sur lesquels des tiers détiennent des droits de propriété intellectuelle. Vous pouvez alors commencer à préparer le terrain. Il vous faut pour cela déterminer la présentation la plus adéquate. Celle-ci dépend de ce que sera le mode d'accès aux données. Les mettez-vous à disposition uniquement en vue de la création d'une application mobile ? Ou bien est-il judicieux de créer un portail Internet destiné à une consultation depuis un PC de bureau ? S'il est suffisamment convivial, son lancement peut en tout cas être une source de trafic et donc de publicité.

Reste ensuite à choisir le mode d'hébergement de ces informations. À défaut de posséder un gros serveur et une équipe informatique capable d'en assurer la gestion, faites appel à un prestataire spécialisé. Il peut fournir un espace de stockage et un nom de domaine adapté. Pensez néanmoins à mettre en place une politique de sauvegarde des données afin de pallier une défaillance de l'hébergeur.

Montrez-vous enfin vigilant sur le niveau de protection. Qu'il s'agisse d'un prestataire ou de votre serveur, pensez à filtrer les accès et à identifier les personnes pouvant administrer ce projet, pour éviter une infiltration sur le réseau interne de l'entreprise. Vous tirerez ainsi parti de votre politique d'ouverture en toute sécurité

DATAMINING : QUATRE PORTAILS À VISITER

DATA PUBLICA Créée en juillet 2011, cette plate-forme privée est un des acteurs historiques de l'open data. www.data-publica.com REGARDS CITOYENS Ce collectif a ouvert en novembre 2010 un portail de recensement des données publiques librement accessibles sur www.nosdonnees.fr DATALIFT 70 Ce projet financé par l'Agence nationale de la recherche vise à développer une plate-forme pour interconnecter des jeux de données. http://datalift.org/fr DATA.GOUV.FR Ouvert en décembre 2011, il permet d'accéder à des données des administrations et les services publics. http://www.data.gouv.fr

Ils ont tiré parti de l'open data

SNCF En ouvrant ses données, elle a inspiré la création d'applications, par exemple pour optimiser son trajet selon le trafic. KEOLIS Avec Rennes Métropole, ce pionnier de l'open data a lancé « l'entrepôt des données », qui facilite la création d'applications NESTORIA Cette start-up implantée dans six pays propose un service payant de consultations d'offres immobilières issues de sites partenaires, associées à des informations sur les transports et services à proximité. OPENSTREETMAP Cette association propose des outils de cartographie élaborés à partir de données librement disponibles, dont le cadastre. CHECKMYMETRO Après un bras de fer avec la RATP, cette start-up a utilisé le plan du métro parisien pour ses applications iPhone et Android.

L'information thématisée

380 000 jeux de données, peuvent être récupérés sur le portail américain ouvert début 2010. De la consommation d'énergie dans les foyers au pourcentage de femmes dans les prisons en passant par la liste des tremblements de terre dans le monde sur les sept derniers jours, on y trouve de tout. Mais le grand public et les entreprises ne se précipitaient pas sur ce portail (652 412 téléchargements en 2010) faute d'informations à haute valeur ajoutée. Pour booster l'utilisation de ses données, l'équipe de data.gov a eu l'idée de créer des communautés d'intérêts autour d'une même thématique, pour catalyser la création de solutions intéressantes dans des domaines comme la santé ou encore l'éducation. 1 079 applications (Web et mobiles) ont été développées.

LEXIQUE

API (Application Programming Interface) : Interface à un ou plusieurs jeux de données permettant à un programme d'y accéder. CKAN (Comprehensive Knowledge Archive Network) : Logiciel open source pour portail open data permettant de publier, de partager et de trouver des données. Mashup : Pratique consistant à combiner différentes sources, le plus souvent externes, pour enrichir son propre site. Web sémantique : Également désigné sous le nom de « Web des données », il désigne l'explicitation du sens des informations afin que les ordinateurs puissent les exploiter de façon automatique, sans ambiguïté et à grande échelle.

OPPORTUNITÉ

Le potentiel économique de l'open data s'élèverait à 27 milliards d'euros, selon la Commission européenne.

vous lisez un article d'Industries & Technologies N°0949

Découvrir les articles de ce numéro Consultez les archives 2012 d'Industries & Technologies

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

ISO 50 001 : pilotez vos performances énergétiques

ISO 50 001 : pilotez vos performances énergétiques

La norme ISO 50 001, publiée il y a un peu plus d'un an, vise à maîtriser les consommations énergétiques de l'entreprise. Encore mal connue dans[…]

01/10/2012 | EXPÉRIENCES
Comment protéger son réseau informatique

Comment protéger son réseau informatique

SPÉCIAL BUREAU D'ÉTUDES

SPÉCIAL BUREAU D'ÉTUDES

Écoconception :un sentier bien balisé

Écoconception :un sentier bien balisé

Plus d'articles