Nous suivre Industrie Techno

Fake news : ces technologies qui les traquent

Fake news : ces technologies qui les traquent

Développé par l’Irisa, un réseau de neurones identifie l’image originale, puis calcule la différence entre les deux images pour mettre en évidence la zone modifiée.

© Hoaxdetector / Irisa

Depuis quelques années, une communauté d’informaticiens tire parti des nouvelles technologies pour lutter contre la désinformation. Intelligence artificielle, big data ou encore réseaux neuronaux assistent les vérificateurs de faits.

À l’approche des élections européennes, l’étau se resserre sur les géants du web en matière de lutte contre la désinformation. Le 29 janvier, la Commission Européenne a en effet présenté son premier bilan neuf mois après le lancement du projet de lutte contre la désinformation, sommant les GAFAM d’intensifier leurs efforts comme le rapporte Courrier international. En parallèle, d’autres avancent dans la lutte contre la désinformation en automatisant la détection de fausses informations ou le fact-checking (vérification des faits). Des chercheurs ont notamment mis au point des solutions logicielles basées sur l’intelligence artificielle ou encore les réseaux neuronaux. Des outils toujours destinés à assister les journalistes ou les citoyens, et non à les remplacer.

En France, Ioana Manolescu, chercheuse en informatique à l’Inria, est l’une des premières à s’être penchée sur le sujet en 2013. Dans le cadre du projet ContentCheck démarré en 2016, quatre laboratoires de recherche ainsi que Les Décodeurs – service de fact-checking du Monde – travaillent ensemble pour mettre au point des logiciels destinés aux journalistes qui vérifient les faits. « Je suis partie du constat que, avec le développement de l’open data, tout le monde a accès à de très nombreuses informations, raconte Ioana Manolescu. Mais ces informations sont disséminées et pas toujours faciles d’accès : c’est très compliqué de les interconnecter. » L’équipe travaille par exemple sur un logiciel qui améliore l’accessibilité des données de l’Insee. Un crawler (robot d’indexation) analyse le site internet, les données sont ensuite extraites grâce à une API et consolidées dans une base de données par un algorithme qui identifie le type de chaque cellule. Le logiciel permet de répondre à la recherche d’un journaliste en retournant une valeur et un lien vers le tableau d’origine.

Trouver les connexions entre les jeux de données

Autre projet dans le cadre de ContentCheck : mettre en connexion des jeux de données hétérogènes. « Nous avons mis au point une méthode qui peut, pour la première fois, s’appliquer à tout type de sources : pages internet, tableaux, tweets, … », détaille la chercheuse. Grâce à différents outils d’extraction d’informations (comme le logiciel NLP de l’Université de Stanford reposant sur des algorithmes d’apprentissage automatique), une base de données commune est construite. Un graphe d’intégration permet d’identifier des entités communes – personnes, organisations, lieux – et ainsi mettre en évidence des connexions, comme des conflits d’intérêt.

À l’Institut de recherche en informatique et systèmes aléatoires, Vincent Claveau, chargé de recherche au CNRS spécialisé dans le traitement automatique des langues, adopte une approche différente pour traquer les fausses informations : « Le but de notre projet est d’identifier automatiquement la provenance d’articles : sites d’information classiques ou sites dits de réinformation. » Leur outil ? L’apprentissage artificiel supervisé. « Nous fournissons des articles de chacune des classes à un algorithme d’apprentissage. Cela nous permet de représenter chaque article sous la forme d’un espace vectoriel, et ainsi de les trier automatiquement », détaille le chercheur. Un certain nombre de critères, identifiés par l’algorithme, permet le tri, comme l’emploi de certains mots, de nombreux points d’exclamation, etc. Le taux de réussite dépasse les 80% une fois l’ordinateur entrainé.

Un réseau de neurones pour traquer les images modifiées

Autre outil de propagande de fausses informations : les images. Vincent Claveau se concentre sur celles circulant sur les réseaux sociaux, souvent modifiées et compressées plusieurs fois : « Le but est de repérer s’il existe une image presque similaire. Un réseau de neurones est entrainé à les identifier, en comparant des représentations vectorielles. » Le calcul de la différence entre les deux images permet ensuite de mettre en avant les zones modifiées, et d’identifier la retouche effectuée. Son équipe commence également à travailler sur la décontextualisation des images, en analysant les caractéristiques des images et du texte associé, toujours grâce au deep learning. « Nous abordons les choses du point de vue de la recherche, mais pour ce projet nous avons des contacts avec le moteur de recherche Qwant. »

Depuis 2013, la Commission Européenne finance de nombreuses initiatives technologiques. Lancé en novembre dernier, le projet SOMA fournit par exemple une infrastructure informatique pilote pour les vérificateurs de faits et les chercheurs. Coordonné par l’entreprise italienne Engineering SpA, leader national dans la transformation digitale, le projet Fandango réunit quant à lui huit partenaires européens. « Notre plan est de développer une plateforme support, détaille Francesco Saverio Nucci, coordinateur du projet Fandango. Nous fournirons d’une part un système de notation et de détection de fake news indépendant du contenu, basé sur des techniques d’analyse de big data. Nous travaillons également à l’investigation des données grâce à l’open data, basé sur des techniques classiques comme la corrélation et la détection d’anomalies de données. »

Si la technologie ne remplace pas l’esprit critique, les avancées majeures en informatique et la fédération de compétences pluridisciplinaires peuvent apporter leur pierre à l’édifice. Vincent Claveau le constate : « Les citoyens ont changé leur regard sur les textes et les images, tout le monde sait qu’ils peuvent être modifiés. Nous allons assister à un changement de paradigme avec l’avènement du deepfake : les vidéos colportent elles aussi de fausses informations. La communauté scientifique se fédère aujourd’hui pour y faire face. »

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

Bertin Nahum veut conquérir le monde avec ses robots chirurgicaux

Bertin Nahum veut conquérir le monde avec ses robots chirurgicaux

Portrait du PDG de Quantum Surgical, Bertin Nahum, qui prépare l’arrivée sur le marché de son prochain robot[…]

« En Europe, la difficulté n’est pas tant la création d’entreprises que leur croissance », selon Chahab Nastar, chef de l’innovation d’EIT Digital

Interview

« En Europe, la difficulté n’est pas tant la création d’entreprises que leur croissance », selon Chahab Nastar, chef de l’innovation d’EIT Digital

La maintenance à distance d’Oculavis récompensée à l’EIT Digital Challenge 2019

La maintenance à distance d’Oculavis récompensée à l’EIT Digital Challenge 2019

Pour bien commencer la semaine : L’étage supérieur d’Ariane 6 a son usine 4.0

Pour bien commencer la semaine : L’étage supérieur d’Ariane 6 a son usine 4.0

Plus d'articles