Vous pensiez que les IA ne pourraient jamais remplacer l’imagination humaine ?


Si les IA peuvent générer des photos de personnes qui n’existent pas, que peuvent-elles imaginer d’autre ?

Dans les années 1980, Hans Moravec, un scientifique de l’IA, a découvert un paradoxe : ce qui est facile pour les humains, comme la compréhension visuelle ou auditive, est difficile pour les machines.

Les choses ont changé depuis. Les IA d’aujourd’hui comprennent beaucoup mieux ce qu’elles voient. Ce n’est pas que l’IA ait rattrapé toutes nos capacités visuelles humaines, mais plutôt que la technologie évolue de différentes façons.

Quand on pense à l’IA, on pense à l’automatisation pure. Ce n’est plus vrai maintenant. Avez-vous pensé, par exemple, que l’IA ne pourrait jamais remplacer les photographes de portraits ? Réfléchissez bien, elle n’a même pas besoin d’un modèle. Aujourd’hui, nous avons des IA qui peuvent “imaginer”, c’est-à-dire, selon la définition de Merriam-Webster, former une image de “quelque chose qui n’est pas présent aux sens ou qui n’a jamais été entièrement perçu dans la réalité”.

La vidéo ci-dessus montre les résultats d’une IA qui a appris à générer des photos de personnes qui n’existent pas. Sur le plan qualitatif, seuls quelques artistes sont capables d’inventer des visages avec une précision photographique.

Le secret de l’imagination de l’IA

Le mécanisme qui confère à l’intelligence artificielle des pouvoirs imaginatifs a un nom : réseaux adverses génératifs (en anglais Generative Adversarial Networks ou GAN). Les GAN s’inspirent en partie de la recherche en neurosciences. Essentiellement, les GAN sont constitués de deux entités qui se font concurrence et apprennent l’une de l’autre : l’une apprend à générer des faux, tandis que l’autre apprend à détecter les faux. Au fur et à mesure que le faux détecteur devient plus efficace, le faux générateur le devient aussi. Les neuroscientifiques ont découvert que nous utilisons un mécanisme connexe, le modèle acteur-critique, que l’on croit situé à peu près au milieu de notre cerveau.

Si l’imagination n’est plus un privilège de l’esprit humain, comment pouvons-nous exploiter l’imagination des IA ? Voici un avant-goût de ce qui se passe dans les laboratoires en ce moment.

Transformer la nuit en jour : que les GAN soient

L’imagination a une application directe : deviner la représentation d’un sujet d’une manière différente, c’est-à-dire traduire une image d’une représentation à une autre. Par exemple, cette IA imagine à quoi ressemblerait l’esquisse d’une photographie, ou à quoi ressemblerait la version couleur d’une photographie en noir et blanc.

Une application de la traduction d’images est de nous aider à voir le monde d’une manière plus lisible, ou au-delà de ce qui est visible.

Image : Laboratoire de vision par ordinateur, Département de technologie de l’information et de génie électrique, ETH Zurich, Suisse

Cette IA, quant à elle, simule le jour à partir d’une photo de nuit. C’est un atout précieux, car la création de voitures autonomes qui fonctionnent et peuvent se localiser précisément dans toutes les conditions – jour, nuit, brouillard, pluie, neige et ainsi de suite – nécessite de nombreuses données couvrant tous les scénarios. La collecte de grandes quantités de données dans toutes les conditions est pratiquement très difficile, car certaines conditions (comme la neige) sont très rares dans certaines régions. Au lieu de recueillir plus de données, les scientifiques ont mis au point cette solution de contournement au jour le jour. Cela pourrait également améliorer la vision nocturne des militaires, des pilotes d’avion et des conducteurs humains.

Quand quelque chose n’est pas directement visible, les GAN sont utilisés pour faire des suppositions éclairées. Prenons le cas de l’IA BodyNet (voir ci-dessus), qui estime la forme corporelle d’une personne à qui l’on a donné une photo d’elle entièrement vêtue. Le mannequin numérique est utile pour concevoir des vêtements sur mesure sans prendre de mesures à la main ou à l’aide de scanners corporels sophistiqués.

Et si on pouvait voir à travers les murs ? Cette IA peut littéralement vous aider à suivre comment les gens se déplacent derrière les murs. Tout comme les chauves-souris voient dans l’obscurité, un signal est émis et ce qui revient est interprété. Les chauves-souris émettent des ultrasons qui sont réfléchis par la surface des objets à proximité. Ici, ce sont les signaux de la gamme WiFi qui sont émis. Comme le WiFi peut traverser les murs mais est en partie réfléchi par notre corps humain, ce signal est interprété par une architecture d’apprentissage profond (voir vidéo ci-dessous).

Machines de découverte

La capacité de faire des suppositions éclairées ne se limite pas à la génération d’images ou à la traduction. L’imagination est, dans un sens plus large, un outil de découverte et a des applications dans divers domaines tels que la cybersécurité ou la conception de médicaments.

Les outils modernes de cybersécurité comportent des IA qui peuvent détecter les menaces en examinant leurs caractéristiques. Les chercheurs ont conçu un GAN qui apprend à générer des morceaux de code malin qui peuvent contourner ces détecteurs de cybersécurité. Cela peut sembler effrayant, mais la bonne nouvelle, c’est que nous pourrions aussi l’utiliser pour mettre au point des détecteurs de codes malins – ou, si vous y pensez, la tromperie peut parfois être une bonne chose, par exemple lorsque nous concevons des médicaments pour combattre des maladies.

Qu’est-ce que cela signifie pour nous ?

La 4e révolution industrielle ne concerne pas seulement l’automatisation, mais aussi la collaboration et la symbiose homme-machine. Les GAN sont un point tournant dans le développement de l’IA et nous aideront à surcharger nos capacités mentales.

Ils sont aussi un outil avec lequel nous pouvons étudier les mécanismes de l’imagination et nous aider à mieux comprendre le rôle de l’imagination dans des domaines tels que la traduction ou la découverte. Même si l’imagination n’est pas synonyme de créativité, c’est l’un des outils que nous utilisons pour inventer de nouvelles choses. Quelles sont les pièces manquantes, encore à découvrir, qui nous permettront de construire des machines capables de nous surpasser dans le domaine créatif également ?

Lire aussi : Deepfake : des chercheurs présentent un logiciel qui permet d’éditer le discours d’une vidéo et faire dire au sujet ce que vous voulez

Sources : Big Think, The World Economic Forum – Traduit par Anguille sous roche


Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *