
DeepCubeA, un algorithme d’apprentissage profond par renforcement, a résolu un Rubik’s Cube en un temps record. Cette performance pourrait être appliquée à la robotique.
Les meilleurs humains résolvent un Rubik’s Cube en quelques secondes et une cinquantaine de mouvements. DeepCubeA y arrive en une seconde. Avec un peu plus de temps, cet algorithme développé à l’Université de Californie, à Irvine, parvient plus d’une fois sur deux à trouver la solution minimisant le nombre de mouvements. Il s’appuie sur l’apprentissage profond par renforcement (deep reinforcement learning).
Entraîner un réseau de neurones profond par renforcement – le faire apprendre à partir d’expériences en lui octroyant des récompenses lorsque les décisions prises sont les bonnes – a déjà fait des merveilles au jeu de go et aux échecs avec AlphaZero. C’est une première pour le Rubik’s Cube. « À ma connaissance, cela n’a jamais été fait », déclare Pierre Baldi, l’un des chercheurs à l’origine de DeepCubeA, coauteur de l’article paru dans Nature Machine Intelligence, en juillet. Le Rubik’s Cube présente en effet une complexité[…]
Pour lire la totalité de cet article, ABONNEZ-VOUS
Déjà abonné ?
Pas encore abonné ?
vous lisez un article d'Industries & Technologies N°1024
Découvrir les articles de ce numéro Consultez les archives 2019 d'Industries & Technologies