Une IA apprend d’elle-même à résoudre un Rubik’s Cube en 20 coups


Le Rubik’s Cube n’est pas à la hauteur d’un nouveau système d’intelligence artificielle, selon les chercheurs.

ia-rubiks-cube

Depuis son invention par un architecte hongrois en 1974, le Rubik’s Cube a sillonné les sourcils de ceux qui ont essayé de le résoudre.

DeepCubeA, un algorithme d’apprentissage par renforcement profond, peut trouver la solution en une fraction de seconde, sans connaissance spécifique du domaine ou coaching en jeu de la part des humains.

Ce n’est pas une tâche simple étant donné que le cube a des chemins d’achèvement se chiffrant en milliards, mais un seul état d’objectif – chacun des six côtés affichant une couleur unie – ne peut apparemment pas être trouvé par des mouvements aléatoires.

Pour la nouvelle étude, les chercheurs ont démontré que DeepCubeA a résolu 100 % de toutes les configurations de test, trouvant le chemin le plus court vers l’objectif environ 60 % du temps. L’algorithme fonctionne également sur d’autres jeux combinatoires tels que le jeu de pousse-pousse, Lights Out, et Sokoban.

“L’intelligence artificielle peut vaincre les meilleurs joueurs d’échecs et de go du monde, mais certains des puzzles les plus difficiles, comme le Rubik’s Cube, n’avaient pas été résolus par les ordinateurs, alors nous pensions qu’ils étaient ouverts aux approches IA”, a dit Pierre Baldi, auteur principal, professeur en informatique à l’Université de Californie, Irvine.

“La solution au Rubik’s Cube implique une réflexion plus symbolique, mathématique et abstraite. Il s’agit d’une machine d’apprentissage en profondeur capable de résoudre un tel casse-tête. Elle est en train de devenir un système capable de penser, de raisonner, de planifier et de prendre des décisions.”

Les chercheurs voulaient comprendre comment et pourquoi l’IA a agi et combien de temps il a fallu pour perfectionner sa méthode. Ils ont commencé par une simulation informatique d’un puzzle terminé et ont ensuite brouillé le cube. Une fois le code en place et opérationnel, DeepCubeA s’est entraîné en isolement pendant deux jours, résolvant une série de combinaisons de plus en plus difficiles.

“Elle a appris toute seule”, note Baldi.

Il y a des gens, surtout des adolescents, qui peuvent résoudre le Rubik’s Cube à la hâte, mais même eux ont besoin d’environ 50 coups.

“Notre IA met environ 20 coups, la plupart du temps en résolvant le problème en un minimum de mouvement”, a dit Baldi. “Là, vous voyez que la stratégie est différente, donc je pense que la forme de raisonnement de l’IA est complètement différente de celle d’un humain.”

L’objectif ultime de projets comme celui-ci est de construire la prochaine génération de systèmes d’IA, explique M. Baldi. Qu’ils le sachent ou non, l’intelligence artificielle touche les gens tous les jours grâce à des applications comme Siri et Alexa et des moteurs de recommandation qui travaillent dans les coulisses de leurs services en ligne favoris.

“Mais ces systèmes ne sont pas vraiment intelligents ; ils sont fragiles et on peut facilement les casser ou les tromper”, a ajouté Baldi. “Comment créer une intelligence artificielle avancée plus intelligente, plus robuste et capable de raisonner, de comprendre et de planifier ? Ce travail est un pas vers ce but ambitieux.”

L’étude publiée dans Nature Machine Intelligence.

Lire aussi : Vous pensiez que les IA ne pourraient jamais remplacer l’imagination humaine ?

Sources : Curiosity, Futurity – Traduit par Anguille sous roche

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *