Nous suivre Industrie Techno

Comment Owkin entraîne des modèles d'IA sans transférer les données avec le federated learning

Emilie Dedieu
Soyez le premier à réagir

Soyez le premier à réagir

Comment Owkin entraîne des modèles d'IA sans transférer les données avec le federated learning

Romain Goussault (gauche) Sebastian Schwarz (droite) d'Owkin au salon Big Data & AI 2021.

Entraîner localement des algorithmes de machine learning, avant de les agréger en un modèle plus performant, le tout sans transférer les données : c'est le federated learning. De quoi concilier confidentialité des données et performance. Explications avec Owkin, start-up implantée en France et à New-York, spécialiste de cette méthode à peine sortie du monde de la recherche.

Faire voyager les modèles d'intelligence artificielle plutôt que les données. C'est le principe du federated learning, ou apprentissage fédéré, qui protège ainsi la confidentialité des données. Surtout exploré dans le monde de la recherche, ce type de machine learning rentre peu à peu dans l'industrie. La start-up Owkin, spécialisée dans l’intelligence artificielle, en a fait son cœur de métier.

Owkin Connect, le logiciel de federated learning développé par la start-up, permet de relier sur une même plateforme différents partenaires. Depuis leurs propres interfaces, les data scientists vont pouvoir entraîner leurs modèles à partir de données auxquels ils n’ont pas accès. « Concrètement, un modèle va être initié, puis partagé avec tous les participants. Chacun va recevoir le modèle et procéder à un entraînement local, expose Sebastian Schwarz, responsable de stratégie produit chez Owkin. Une fois cette étape finie au sein des infrastructures et derrière les pare-feu, les paramètres des modèles locaux vont être envoyés à un agrégateur central – qui peut être l’un des centres ou Owkin – pour effectuer un moyennage. On aura alors un modèle qui sera une fusion des résultats locaux. »

Des données qui restent confidentielles

Ce processus va être répété une vingtaine de fois, renvoyant un modèle de plus en plus élaboré aux participants, jusqu’au modèle final. « Les participants obtiennent un modèle qu’il aurait été impossible d’avoir seul, plus prédictif et plus performant, affirme Romain Goussault, chef de produit. Par exemple, si le CHU de Nantes souhaite entraîner un modèle pour différencier les grains de beauté des tumeurs de la peau, mais ne le fait que sur des patients nantais, il lui manquera de nombreux types de peau plus clairs ou plus bronzés, et cela ne sera pas généralisable. »

Le fait de ne pas faire transiter les données représente un atout, notamment pour le traitement d’informations lourdes, qui peuvent donc rester sur place, mais surtout pour préserver la confidentialité des données. « Une de nos équipes tente de savoir s’il est possible de reconstituer une information à partir du modèle, mais pour l’instant c’est impossible. », assure Sebastian Schwarz.

Partenariats entre hôpitaux

Idéal donc pour mettre en place des partenariats entre des hôpitaux qui ne peuvent pas divulguer les informations de leurs patients, ou pour les entreprises qui souhaitent faire de la coopétition. Deux consortiums ont pour l’instant souscrit à ce système : HealthChain, un réseau d’hôpitaux et Melloddy, le regroupement de dix entreprises pharmaceutiques (dont AstraZeneca, Bayer, GSK ou encore l’institut de recherches Servier).

Owkin se concentre donc sur le domaine médical et le développement de technologies associées. HealChaine travaille par exemple sur un modèle capable de prédire la réponse à la chimiothérapie d’une patiente atteinte du cancer du sein à partir de lame de prélèvement. D’autres plateformes de federated learning sont en route, comme FATE (Federated AI Technology Enabler), conçue par le chinois Webank AI, axée sur la finance, mais les exemples d'applications sont encore rares.

« Le federated learning un sujet de recherche actif, qui reste très expérimental et, pour l’instant, assez décorrélé de l’industrie, confirme Sébastian Schwarz. Mais on peut aussi dire que c’était le cas du machine learning jusqu’à ces dernières années. »

 

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

Trois plateformes XDR lancées lors des Assises de la cybersécurité

Trois plateformes XDR lancées lors des Assises de la cybersécurité

Centraliser les données de cybersécurité de différentes sources pour assurer une analyse globale en évitant la[…]

Cybersécurité industrielle : 6 mois pour sécuriser une usine

Dossiers

Cybersécurité industrielle : 6 mois pour sécuriser une usine

Des millions de modèles de machine learning pour accélérer le contrôle qualité chez Volkswagen

Des millions de modèles de machine learning pour accélérer le contrôle qualité chez Volkswagen

La mémoire quantique fait une entrée fracassante dans la course à l'ordinateur quantique

La mémoire quantique fait une entrée fracassante dans la course à l'ordinateur quantique

Plus d'articles