Les données s'installent au coeur de la stratégie des entreprises. S'appuyant sur des réseaux de capteurs, les usines de demain produiront en permanence de l'information sur les procédés de production, la gestion des stocks, l'acheminement des lots, et elles seront même connectées en permanence avec les produits qu'elles ont fabriqués. Toutes ces données devront être stockées et analysées afin d'optimiser la maintenance et d'améliorer la qualité. Pour les entreprises, ce « data déluge » est une opportunité, mais aussi un vrai défi. Qu'on en juge plutôt : selon diverses estimations, tous les deux ans, il se crée en effet autant de données que depuis le début de l'humanité, ce qui amène les prévisionnistes à parler de 40 milliards de téraoctets pour 2020. Appliquées au machine to machine (M to M), les applications du big data peuvent être multiples et variées. Les entreprises ont intérêt à tirer profit de cette avalanche de données... sans pour autant se laisser déborder, ou faire exploser le volume de leurs infrastructures dédiées au stockage. D'autant moins que les nouvelles données sont trop complexes et volumineuses pour pouvoir être traitées par des systèmes informatiques et des bases de données standards.
Des calculs pour obtenir des données à forte valeur ajoutée
Pour les valoriser, il convient de tenir compte des particularités de ces données massives, hétérogènes, à la fiabilité parfois délicate à contrôler, et nécessitant un traitement rapide (voir l'encadré sur le défi des 4V). Ce qui nécessite d'apprendre à bien maîtriser cet univers, et de savoir choisir la solution adaptée pour répondre aux problématiques de l'entreprise.
Les solutions proposées par les spécialistes de l'analyse des big data s'appuient principalement sur des moteurs de recherche professionnels, destinés aux entreprises. Ces outils sont beaucoup plus efficaces et « intelligents » que Google, dont les résultats s'appuient uniquement sur la popularité (d'un point de vue statistique) d'une information. Pour traiter ces gros volumes de données disparates, ils utilisent trois types de technologies distinctes : les bases de données In-memory, les bases de données NoSQL, ou encore MapReduce, de Google (voir encadré). Quelle que soit l'option retenue,[…]
Pour lire la totalité de cet article, ABONNEZ-VOUS
Déjà abonné ?
Pas encore abonné ?
vous lisez un article d'Industries & Technologies N°0963
Découvrir les articles de ce numéro Consultez les archives 2014 d'Industries & Technologies