Nous suivre Industrie Techno

Covid-19 : Comment l’intelligence artificielle peut aider à trier l’information médicale

Martin Clavey
Soyez le premier à réagir

Soyez le premier à réagir

Covid-19 : Comment l’intelligence artificielle peut aider à trier l’information médicale

© NIAID

L’information sur le covid-19 s’accroit de jour en jour au point de nous perdre dans un amas de connaissances scientifiques et de discussions sur les réseaux sociaux plus ou moins pertinentes. Résumés d’articles scientifiques, prédiction sur Twitter des épidémies ou recherche d’informations essentielles, le traitement automatique du langage (TAL) est un outil puissant pour aider la médecine a y voir plus clair.

Depuis le début de l’épidémie, les chercheurs en traitement automatique du langage (TAL), ce domaine de l’intelligence artificielle qui cherche à manipuler le langage humain avec des machines, ont réfléchi aux moyens automatiques qu’ils pouvaient mettre en place pour clarifier l’information sur la pandémie. Les textes, qu’ils soient publiés sur les réseaux sociaux, dans les revues scientifiques ou dans les comptes-rendus de diagnostic peuvent être une mine d’or d’information mais leur abondance et la complexité de la langue rendent difficile leur analyse.

Dès les années 1950, les chercheurs en informatique ont essayé d’étudier son fonctionnement mais le langage est un objet difficile à étudier et à modéliser. Ce n’est pas comme un phénomène physique dont on connaîtrait le fonctionnement général. Il n’existe pas de modèle général de ce qu’est la langue. Depuis 5 à 6 ans, pour éviter cette difficulté de modélisation, les chercheurs en TAL utilisent de plus en plus le Deep learning. Cette technique permet d’éviter la compréhension du fonctionnement de ce qu’on veut modéliser au prix d’un nombre très élevé de données d’entraînement.

Résumer automatiquement des articles scientifiques

Intervenant dans la journée « Intelligence artificielle : l’ordinateur passe la barrière de la langue » organisée par le CNRS le 12 janvier, Benoit Favre, chercheur au Laboratoire d'Informatique et Systèmes (LIS) d’Aix-Marseille Université explique qu’en contribuant comme d’autres à l’impression 3D de visières protectrices lors du premier confinement, il est entré en contact avec le médecin Stéphane Delliaux, qui lui a fait part de l’embarras dans lequel il se trouvait face à l’amoncellement de publications sur la pandémie : 2000 à 3000 articles scientifiques par semaine étaient mis en ligne, il était impossible de toutes les connaître et encore moins d’avoir un avis sur leur pertinence. Cette discussion a permis de mettre en place un premier prototype de travail sur les articles scientifiques, puis un soutien à la plateforme Bibliovid de veille scientifique sur la COVID, en collaboration avec les chercheurs de Naver Labs Europe de Grenoble.

Si « la plateforme est en pause car les médecins impliqués ont repris leur activité, l'idée du projet est surtout de voir comment on pourrait faciliter la veille scientifique dans le cas d'un nouvel événement majeur », explique le chercheur. Et le travail de recherche sur le corpus d’articles scientifiques continue. L’idée est de créer, grâce au TAL, des résumés automatiques des articles qui soient réellement intéressants pour les médecins (résultats à retenir, niveau de preuve de l’article, méthodes utilisées…).

Si certains projets demandent du temps pour être opérationnels d’autres ont déjà permis aux biologistes et autres médecins d’y voir un peu plus clair dans ce flux continu d’information et de réaction difficile à suivre.

Prédire les pandémies sur Twitter

Des chercheurs en traitement automatique du langage de l’Université de Californie ont analysé des corpus importants de tweets publiés dans différents pays pendant la pandémie (Italie, Japon, Thailande, Turquie et Indonésie) et en ont ressorti un modèle capable de prédire une épidémie. Benoît Favre explique que cette étude a permis d’établir que « la trace linguistique [de l’arrivée du virus], quelle que soit la langue, est similaire ». On pourrait donc appliquer ce modèle de prédiction dans n’importe quel pays. Les auteurs appellent maintenant les réseaux sociaux à se saisir de leur recherche pour prédire les épidémies et améliorer le système global de détection.

Extraction des cas positifs dans des textes cliniques

D’autres chercheurs se sont attelé à traquer les cas positifs qui ne se trouvaient pas dans les bases de données informatique. En effet, à cause de la mauvaise interopérabilité des systèmes de stockage des données, certains cas positifs étaient difficilement intégrables dans les bases de données. Une équipe de recherche du département des anciens combattants américains a mis au point une technique pour compléter les informations manquantes en analysant les textes cliniques libres des dossiers des patients.

Cette technique a vraiment eu des conséquences importantes puisqu’à l'aide d'approches similaires, une équipe de l’Hopital Necker a réussi à démontrer un lien entre la prise d’inhibiteurs calciques et la baisse de mortalité chez les patients atteints de la Covid. « Ce lien n’aurait pas pu être démontré si on n’avait pas utilisé le traitement du langage naturel parce qu’il n’y avait pas suffisamment de données structurées pour que le lien soit significatif statistiquement. Grâce à l’ajout des données qui proviennent du langage naturel, on a eu suffisamment de données pour montrer que ce lien était statistiquement significatif » affirme Benoît Favre.

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

[Reportage] Dans les coulisses de l’innovation du Zürich lab d’IBM

[Reportage] Dans les coulisses de l’innovation du Zürich lab d’IBM

En surplomb du lac de Zürich, le laboratoire de recherche européen d’IBM renferme dans ses sous-sols de nombreux ateliers.[…]

25/11/2021 | IBM
Lancement d’EXA1, la première partition du nouveau supercalculateur du CEA/DAM et d’Atos

Lancement d’EXA1, la première partition du nouveau supercalculateur du CEA/DAM et d’Atos

Puce quantique de 127 qubits : feuille de route tenue pour IBM

Puce quantique de 127 qubits : feuille de route tenue pour IBM

Le SOC, la pierre angulaire d’une cyberprotection unifiée

Dossiers

Le SOC, la pierre angulaire d’une cyberprotection unifiée

Plus d'articles