Nous suivre Industrie Techno

Protection des données personnelles : "soyons vigilants dans ce (big) dataclysme"

Protection des données personnelles :

Daniel Benchimol, Président du cluster numérique DigitalPlace

©

Le concept de Big Data est-il une mode, un concept éphémère ou une réelle révolution ? C’est la question que se pose Daniel Benchimol, Président du cluster numérique DigitalPlace, dans cette tribune.

"Comment en sommes-nous arrivés là ? Nous produisons, nous, en tant qu'individus mais aussi nos industries, des données en masse. On s'est ensuite demandé si nous pouvions en faire quelque chose, il fallait donc des calculateurs plus puissants mais aussi des analystes qui pouvaient construire des modèles mathématiques statistiques pour en tirer des lois statistiques. Mais pour vraiment peaufiner les modèles, on a bien compris que les données pouvaient être hétérogènes et mélangées, qu'on pouvait croiser, par exemple, des données environnementales, les combiner à des données sociétales ou culturelles, etc...

L'intelligence artificielle embarquée dans des dispositifs de « Machine Learning » pourrait, avec des algorithmes puissants, faire du prédictif. Nous maîtriserions le temps et ce qui s'y passerait avec une probabilité forte. Deux mondes différents s'intéressent aux Big Data : le monde des industries et des entreprises pour l'amélioration de leur business model (production, commercialisation) et ceux qui évoluent dans le B2C, qui doivent toucher les consommateurs comme vous et moi.

Dans le monde de l'entreprise                           

Dans l'industrie aéronautique, les essais en vol d'un avion produisent deux TéraOctets (1000 milliards d'Octets) de données venant de plusieurs milliers de capteurs. Le Big Data permet d'analyser tous les dysfonctionnements à la vitesse des super calculateurs. Cela permet dès la conception de l'avion de comprendre les algorithmes à mettre en place qui feront de la maintenance prédictive permettant d'anticiper les pannes, et d'optimiser les heures de vol (une heure de vol coûte 10 à 12 000 $). Ainsi, on arrive à faire de l'analyse prédictive de maintenance d'un avion. Cette meilleure maîtrise est rendue possible par l'enrichissement de la connaissance, et par un meilleur traitement de la donnée, permet à ceux qui l'osent de disrupter leur business model.

L’industrie automobile a bien compris l'avancée technologique que représentent les Big Data. En effet, plusieurs enjeux sont à considérer. Nous voulons tout comprendre sur la voiture en tant que machine, tout analyser sur les types de conduites des conducteurs (interaction de l'humain avec la machine) mais aussi sur le comportement de la voiture dans son environnement afin d'établir les bases de connaissances indispensables à la voiture autonome. Le véhicule devient ainsi un objet connecté avec son environnement. Sans l'analyse et le traitement en temps réel de données massives intégrant des données hétérogènes et des données aléatoires, nous ne pourrions imaginer un seul instant que demain nous ne conduirons plus nos voitures. Nous serons à l'arrière avec nos tablettes en train de travailler.

Dans le B2C

Les assureurs entrent dans une nouvelle ère de personnalisation de leurs offres, appuyée sur une analyse très fine des profils de risques de leurs clients. Pour ce faire, l'analyse de données massives leur permet de profiler une offre d'assurance auto en fonction de votre lieu de résidence, de votre façon de conduire, du nombre de kilomètres que vous parcourez, des statistiques météo du lieu où vous conduisez, de votre âge, etc... C'est ce qu'ils appellent le « Pay How You Drive ». Bien sûr, on peut considérer que les incitations au prix que peuvent faire les assureurs constituent un moyen de prévention pour réduire les sinistres, mais le fait que les assureurs aient accès à toutes nos données médicales comportent un vrai risque sur lequel je ne m'étendrai pas. 

Des conséquences insoupçonnées ?

Parce que nous vivons connectés en permanence, nous ignorons à quel point nous produisons des données. Nous sommes non seulement utilisateurs d'Internet mais aussi utilisés par Internet. Les données collectées à notre insu viennent de toutes les applications que nous avons sur nos smartphones et pour lesquelles nous avons accepté les Conditions Générales d'Utilisation sans les lire (73% n'ont pas lu une seule ligne et les 26% restant n'y sont restés que quelques secondes). Ces applications peuvent accéder à nos données, connaitre tout de notre vie, et conjuguées à la géolocalisation, enregistrer tous nos faits et gestes. Les « data brokers » (nom donné aux courtiers en données) peuvent revendiquer des fiches détaillées sur un nombre incroyable de personnes : 700 millions pour l'un des plus importants dans le monde. La donnée se vend entre 0,6 cts et 25 cts d'euros pour les plus complètes et l'industrie de la data devrait générer environ 21 Milliards d'euros en 2016 selon Gartner.

Mais comment ces données arrivent-elles à être dans les ordinateurs ? Simplement, par des moteurs de capture d'informations. L'étude Mobilitics de la CNIL et de l'INRIA montre que sur une période de 3 mois, certaines applications mobiles accèdent 700.000 fois aux données de géolocalisation venant du smartphone. Ainsi, il existe un avatar de chacun d'entre nous, notre « clone digital », qui en sait plus sur vous que vous-même car il a une mémoire infinie. Par exemple, il sait ce que j'ai acheté il y a deux ans, où je suis allé il y a 18 mois en vacances et combien de temps j'y suis resté. Mais le problème, c'est que cet autre moi ne m'appartient pas.

Qu’en est-il de nos données biologiques ?  

Notre capacité d'acceptation de ce contexte s'accroit avec le temps; mais aussi avec le progrès que les scientifiques apportent à la société. En matière médicale, la techno-médecine, l'ingénierie génétique, ont permis de faire de vréitables "sauts quantiques" dans la connaissance de l'homme, grâce aux BIG DATA. La révolution des NBIC (Nanotechnologies, Biotechnologies, Information, Sciences Cognitives) a permis de collecter et croiser d'énormes masses de données. Ces données sont traitées par des ordinateurs qui atteignent maintenant quasi l'ExaFlops (1 milliards de milliards d'opérations par seconde - en 1986 on était seulement à 1 milliard par seconde). Cela, a permis entre autres, le séquencement de l'ADN et son stockage sur une clé USB, et ce pour quelques centaines de dollars. Dans ce domaine, le prédictif est motivant : savoir qu'avec tel gène, nous avons une probabilité importante de développer un cancer à 50 ans... La tentation devient forte de corriger le gène à risque.

La manipulation des idées par des techniques d'influence

Les algorithmes repèrent sur les réseaux sociaux vos idées politiques ou sociétales et vous poussent les informations que vous souhaitez entendre pour vous conforter dans vos idées ou croyances. Les élections aux US en ont été la preuve flagrante. Des études ont analysé les tweets et certains étaient émis par des machines pour influencer l'électorat. Pire encore, Obama a répertorié des fakes, des informations fausses relayées par des communautés entières sur Facebook. Dans les trois derniers mois précédents les élections américaines, près de 20 histoires mensongères ont généré 8,7 millions de partages, réactions et commentaires sur Facebook. Sachant que 62% des adultes américains écoutent les news sur les media sociaux...

Obama s'est épanché sur le sujet auprès de Mark Zuckerberg, sans succès. D'ailleurs, un hackaton a été organisé à l'Université de Princeton pour créer un logiciel à base d'intelligence artificielle qui filtre les nouvelles en leur donnant par recoupement un label de vérification. Bien sûr, ce logiciel ne s'intéresse qu'aux faits, pas aux opinions. La société devient un puzzle de communautés d'êtres humains, séquencés par les technologies Big Data qui dégagent des tendances et modes de vie. De ces corrélations, on déduira des tendances prédictives, et l'interaction que l'homme aura avec les objets connectés renforcera la fiabilité de la prédiction.

Il faut agir dans le sens du progrès en se prémunissant de toutes les dérives sur ce qui est d'ordre privé « privacy ». Car la vie privée de chacun est le fondement d'une société libre. C'est un acquis sur lequel il ne faut pas transiger. Alors, dans ce dataclysme soyons vigilants."

Daniel Benchimol, Président du cluster numérique DigitalPlace

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

Le centre Inria Lille met l'IA à l’honneur

Le centre Inria Lille met l'IA à l’honneur

Implanté au cœur du pôle d’excellence EuraTechnologies, le bâtiment « Place », fraîchement[…]

L'intelligence artificielle pour viser le flux tendu

Focus

L'intelligence artificielle pour viser le flux tendu

"Donner plus d'intelligence aux machines"

Dossiers

"Donner plus d'intelligence aux machines"

Les systèmes cyberphysiques s'autonomisent

Dossiers

Les systèmes cyberphysiques s'autonomisent

Plus d'articles