Nous suivre Industrie Techno

Intelligence artificielle : AlphaGo s'affranchit de ses professeurs

Intelligence artificielle : AlphaGo s'affranchit de ses professeurs

© DeepMind

L'intelligence artificielle joueuse de go, mise au point par Google, est désormais capable d'apprendre par elle-même. En quelques jours, elle a développé sa propre banque de coups, se plaçant ainsi très nettement au dessus des joueurs humains. Cette nouvelle faculté ouvre la voie aux IA de nouvelle génération.

AlphaGo, l’intelligence artificielle de la société DeepMind, et tombeuse des meilleurs joueurs de go du monde en 2015 et 2016, a finalement trouvé son maître… elle-même. Ou plutôt une version mise à jour. La filiale de Google a en effet perfectionné son programme de « deep learning », fondé sur un réseau de neurones artificiels et a mis au point AlphaGo Zero. Sa particularité ? Un apprentissage autonome, se passant de toute intervention humaine. Les premières versions de l’intelligence artificielle de DeepMind nécessitaient que plusieurs spécialistes leur enseignent les meilleures ouvertures de jeu ou certaines stratégies incontournables à haut niveau. Pour AlphaGo Zéro, seules les règles de base du jeu, et un temps de préparation, lui ont été octroyés.

Un apprentissage exponentiel

L’IA a donc joué plusieurs millions de parties contre elle-même. « A chaque partie, le réseau neuronal est recombiné avec un algorithme de recherche, pour créer une version mise à jour d'AlphaGo Zero. Le processus est répété et, à chaque itération, la performance du système est améliorée, augmentant ainsi la qualité des parties jouées et la précision du réseau neuronal », détaille DeepMind dans un communiqué. Une forme d’apprentissage exponentielle donc, qui a permis à AlphaGo Zero de se mesurer au bout de trois jours à la version qui a été utilisée en 2016 pour battre le champion coréen Lee Sedol. Et le résultat est sans appel : l’IA en apprentissage autonome a défait son homologue supervisée, 100 parties à 0, tout en se payant le luxe d’afficher une consommation énergétique presque 10 fois inférieure.

Au bout de 21 jours, le logiciel a atteint, seul, un niveau permettant de battre les 60 meilleurs joueurs de go du monde. Pour DeepMind, la faculté d’auto apprentissage de son programme est une réponse à la critique formulée par ses principaux détracteurs : la part de connaissance humaine injectée dans le moteur de calcul. Ce reproche avait également été exprimé en 1997, lorsque le programme joueur d’échecs d’IBM, Deep Blue, avait battu le champion du monde de l’époque Gary Kasparov. Pour de nombreux experts, l’apprentissage autonome amorce bel et bien une nouvelle ère pour les intelligences artificielles.

Bienvenue !

Vous êtes désormais inscrits. Vous recevrez prochainement notre newsletter hebdomadaire Industrie & Technologies

Nous vous recommandons

Pour bien commencer la semaine : Chez Renault, un jumeau numérique pour optimiser la production

Pour bien commencer la semaine : Chez Renault, un jumeau numérique pour optimiser la production

Difficile de trouver la motivation en ce début de semaine ? Voici une petite sélection d’innovations qui pourraient vous aider[…]

Avec le jumeau numérique de Cosmo Tech, Renault optimise sa production de moteurs

Avec le jumeau numérique de Cosmo Tech, Renault optimise sa production de moteurs

Intelligence artificielle : comment Facebook veut doter les robots d’un « sens commun »

Intelligence artificielle : comment Facebook veut doter les robots d’un « sens commun »

Avec sa « Ruche », Thalès apporte de l’agilité au développement des solutions de cyberdéfense

Avec sa « Ruche », Thalès apporte de l’agilité au développement des solutions de cyberdéfense

Plus d'articles