L’IA DeepMind de Google a maintenant une mémoire


Imiter le cerveau humain

Depuis 2014, DeepMind joue à des jeux vidéo Atari. Au départ, ses systèmes d’apprentissage automatique pouvaient apprendre à gagner des jeux et à battre des scores humains, mais ne se souvenaient pas comment il avait réussi à le faire. Par conséquent, pour chaque jeu Atari, un nouveau réseau neuronal a été créé. DeepMind n’a jamais bénéficié de sa propre expérience : jusqu’à maintenant.

Une équipe de chercheurs de DeepMind et de l’Imperial College de Londres a créé un algorithme qui confère de la mémoire au système, lui permettant d’apprendre, de conserver les connaissances et de les réutiliser. Le système utilise l’apprentissage supervisé et les tests d’apprentissage de renforcement pour apprendre en séquences.

Dans le cerveau humain, la consolidation synaptique est la base de l’apprentissage continu. Sauvegarder les connaissances apprises et les transférer d’une tâche à l’autre est essentiel à la façon dont les humains apprennent. L’impossibilité de le faire a été un échec clé dans l’apprentissage automatique. L’algorithme, appelé «consolidation de poids élastique» (EWC), choisit les parties les plus utiles de ce qui a aidé la machine à jouer et à gagner des jeux dans le passé, puis ne transfère que ces parties vers l’avant.

Applications de niveau supérieur

Le système est impressionnant, mais n’est pas encore parfait. DeepMind peut maintenant conserver les informations les plus importantes de ses expériences précédentes afin d’apprendre, mais en dépit de cette énorme banque d’expériences, il ne peut toujours pas fonctionner aussi bien qu’un réseau de neurones qui complète un jeu seul. L’efficacité de l’apprentissage est la prochaine étape si l’apprentissage automatique doit correspondre (ou éventuellement éclipser) l’apprentissage réel.

La consolidation de poids élastique est une composante essentielle de toute intelligence (biologique ou artificielle) car elle permet au penseur d’apprendre des tâches en succession sans oublier. Le nouvel algorithme DeepMind soutient l’apprentissage continu tout comme la consolidation synaptique du cerveau humain, qui est la prochaine étape pour l’IA en termes de maîtrise des tâches plus difficiles et des contextes d’apprentissage. En d’autres termes, cela signifie que les systèmes d’IA progressent pour relever des défis créatifs et intellectuels ; auparavant considérés comme l’unique domaine réservé à l’humanité.

Source : Futurism


Vous aimerez aussi...

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *