Une IA a spontanément développé un “sens” humain pour les nombres

Les chiffres figurent en haut de la liste de ce qu’un ordinateur peut bien faire.

Alors que les humains ont souvent du mal à partager une facture de restaurant, un ordinateur moderne peut faire des millions de calculs en une seconde. Les humains, cependant, ont un sens inné et intuitif des nombres qui nous a aidés, entre autres, à construire des ordinateurs en premier lieu.

Contrairement à un ordinateur, un être humain sait, en regardant quatre chats, quatre pommes et le symbole 4, qu’ils ont tous une chose en commun – le concept abstrait de “quatre” – sans même avoir à les compter. Cela illustre la différence entre l’esprit humain et la machine, et aide à expliquer pourquoi nous ne sommes même pas près de développer des IA avec l’intelligence générale que possèdent les humains. Mais maintenant, une nouvelle étude, publiée dans Science Advances, rapporte qu’une IA a spontanément développé un sens du nombre semblable à celui des humains.

Pour qu’un ordinateur compte, nous devons définir clairement ce que nous voulons compter. Une fois que nous avons alloué un peu de mémoire pour maintenir le compteur, nous pouvons le remettre à zéro et ensuite ajouter un élément chaque fois que nous trouvons quelque chose que nous voulons enregistrer. Cela signifie que les ordinateurs peuvent compter le temps (les signaux d’une horloge électronique), les mots (s’ils sont stockés dans la mémoire de l’ordinateur) et même les objets dans une image numérique.

Cette dernière tâche, cependant, est un peu difficile, car nous devons dire à l’ordinateur exactement à quoi ressemblent les objets avant qu’il puisse les compter. Mais les objets ne se ressemblent pas toujours – les variations d’éclairage, de position et de pose ont un impact, de même que les différences de construction entre les exemples individuels.

Toutes les approches informatiques réussies de détection d’objets dans les images fonctionnent en construisant une sorte d’image statistique d’un objet à partir de nombreux exemples individuels – un type d’apprentissage. Cela permet à l’ordinateur de reconnaître les nouvelles versions des objets avec un certain degré de confiance. La formation consiste à donner des exemples qui contiennent ou non l’objet. L’ordinateur devine ensuite s’il le fait et ajuste son modèle statistique en fonction de l’exactitude de la supposition, telle qu’elle est jugée par un humain qui supervise l’apprentissage.

Les systèmes d’IA modernes commencent automatiquement à être capables de détecter des objets lorsqu’ils sont dotés de millions d’images d’entraînement de toutes sortes – tout comme le font les humains. Ces systèmes d’apprentissage non supervisés remarquent progressivement des parties des éléments des images qui sont souvent présentes en même temps, et accumulent couche après couche des points communs plus complexes.

Prenons l’exemple de la reconnaissance des pommes. Au fur et à mesure que des images contenant toutes sortes de formes sont présentées au système, celui-ci commence d’abord à remarquer les groupes de pixels qui composent les lignes horizontales et verticales, ainsi que les courbes gauche et droite. Ils sont présents dans les pommes, les visages, les chats et les voitures, de sorte que les points communs, ou abstractions, sont trouvés très tôt. Elle finit par se rendre compte que certaines courbes et lignes sont souvent présentes ensemble dans les pommes – et développe une nouvelle abstraction plus profonde qui représente une classe d’objets : les pommes, dans ce cas.

L’apprentissage en profondeur

Cette émergence naturelle d’abstractions de haut niveau est l’un des résultats les plus passionnants de la technique d’apprentissage machine appelée apprentissage profond, qui, dans un certain sens, fonctionnent de la même manière que le cerveau humain. La “profondeur” vient des nombreuses couches du réseau – à mesure que l’information s’approfondit dans le réseau, les points communs deviennent plus abstraits. De cette façon, les réseaux sont créés avec des éléments qui sont fortement actifs lorsque l’entrée est similaire à ce qu’elle a connu auparavant. Les choses les plus abstraites apparaissent aux niveaux les plus profonds – ce sont les chats, les visages et les pommes plutôt que les lignes verticales ou les cercles.

Lorsqu’un système d’IA peut reconnaître les pommes, vous pouvez ensuite l’utiliser pour en compter le nombre. C’est génial, mais ce n’est pas vraiment comme ça qu’on compterait les pommes, vous et moi. Nous avons une conception extrêmement profonde du “nombre”, c’est-à-dire de la quantité de quelque chose qu’il y a. Plutôt que d’être simplement actif lorsqu’un objet est présent, certaines parties de notre cerveau s’activent en fonction de la quantité d’objets présents. Cela signifie que nous pouvons regarder un tas de pommes et savoir qu’il y en a quatre sans compter chacune d’elles.

En fait, beaucoup d’animaux peuvent le faire aussi. C’est parce que ce sens de la numération est un trait utile pour la survie et la reproduction dans un grand nombre de situations différentes – prenons pour exemple la taille des groupes de rivaux ou de proies.

Propriétés émergentes

Dans la nouvelle étude, l’apprentissage profond formé pour la détection simple d’objets visuels a spontanément développé ce type de sens numérique. Les chercheurs ont découvert que des unités spécifiques au sein du réseau se sont soudainement “accordées” sur un nombre abstrait – tout comme les vrais neurones du cerveau pourraient réagir. Il s’est rendu compte qu’une image de quatre pommes est semblable à une image de quatre chats – parce qu’ils ont “quatre” en commun.

Des neurones artificiels accordés sur des nombres préférés de points. Andreas Nieder

Ce qui est vraiment passionnant dans cette recherche, c’est qu’elle montre que nos principes actuels d’apprentissage sont tout à fait fondamentaux. Certains des aspects les plus importants de la pensée des gens et des animaux sont profondément liés à la structure du monde et à l’expérience visuelle que nous en faisons.

Cela laisse également entendre que nous sommes peut-être sur la bonne voie pour parvenir à une intelligence artificielle plus complète, à l’échelle humaine. Appliquer ce type d’apprentissage à d’autres tâches – peut-être l’appliquer à des signaux qui se produisent sur une période de temps plutôt que sur des pixels d’une image – pourrait donner des machines aux qualités encore plus humaines. C’est dans cette nouvelle perspective que nous examinons aujourd’hui ce que nous considérions autrefois comme fondamental pour être humain – le rythme musical, par exemple, ou même le sens de la causalité.

Au fur et à mesure que nous découvrons de nouvelles techniques d’apprentissage artificiel et que nous trouvons de nouvelles façons de comprendre le cerveau des organismes vivants, nous découvrons de nouveaux mystères sur le comportement intelligent et adaptatif.

Il y a encore beaucoup de chemin à parcourir et de nombreuses autres dimensions à explorer, mais il est clair que la capacité de regarder le monde et d’élaborer sa structure à partir de l’expérience est un élément clé de ce qui rend les humains si adaptables. Il ne fait aucun doute qu’il s’agira d’un élément nécessaire de tout système d’IA qui a le potentiel d’accomplir la variété et la complexité des tâches que les humains peuvent accomplir.

Lire aussi : L’intelligence artificielle devient dangereusement bonne pour imiter les comportements humains

Source : The Conversation – Traduit par Anguille sous roche

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *