La voix de Joe Rogan, générée par l’IA, est une mise en garde pour l’avenir

En 2017, une startup appelée “Lyrebird” a fait la une des journaux avec l’IA et a généré des répliques de voix de célébrités qui ont été extrêmement convaincantes.

Les titres postés sur SoundCloud présentaient les voix de Donald Trump, Barack Obama, et Hillary Clinton faisant un pitch pour la nouvelle technologie de Lyrebird. Dans la vidéo, une fausse voix du Président Trump dit : “Ils peuvent nous faire dire n’importe quoi maintenant.”

Bien que l’histoire ait suscité un certain intérêt au début, elle a rapidement disparu du cycle des nouvelles, à l’exception d’un seul endroit, The Joe Rogan Experience Podcast. Joe Rogan a été fasciné par la technologie et en a longuement parlé sur son podcast dans les semaines qui ont suivi la nouvelle.

Au cours des deux années qui ont suivi, M. Rogan a régulièrement informé ses invités de l’incroyable technologie, leur disant que ce n’est qu’une question de temps avant que des voix très réelles et reconnaissables soient imitées et manipulées pour dire un texte spécifique à des fins spécifiques et potentiellement néfastes. Le ciel est probablement la limite à mesure que cette technologie progresse, obtenant de meilleurs résultats avec moins de données.

Curieusement, M. Rogan a été la première cible de célébrités pour les développeurs d’intelligence artificielle qui voulaient montrer tout le chemin parcouru par cette technologie en seulement deux ans. Dans une vidéo diffusée cette semaine, Joe Rogan parle de l’entraînement d’une équipe de hockey composée de chimpanzés intelligents, parmi d’autres rumeurs tout aussi ridicules et amusantes.

“Je viens d’écouter un enregistrement audio généré par l’IA de moi parlant des équipes de hockey des chimpanzés et c’est d’une précision terrifiante. À ce stade, il y a longtemps que j’ai laissé assez de contenu pour qu’ils puissent me faire dire tout ce qu’ils veulent, alors ma position est de hausser les épaules et de secouer la tête avec respect, et de l’accepter tout simplement. L’avenir sera vraiment bizarre, les enfants”, a déclaré Joe Rogan sur Facebook cette semaine.

Dessa, la startup responsable de la vidéo, a expliqué dans un billet de blog qu’il sera de plus en plus facile pour la personne moyenne de faire ce type de répliques.

“Actuellement, l’expertise technique, l’ingéniosité, la puissance de calcul et les données sont nécessaires pour que des modèles comme RealTalk fonctionnent bien. Donc, ce n’est pas n’importe qui qui peut le faire. Mais dans les années à venir (ou même plus tôt), nous verrons la technologie progresser au point où seulement quelques secondes d’audio seront nécessaires pour créer une réplique réaliste de la voix de n’importe qui sur la planète”, peut-on lire dans l’article.

La réplique de la voix de Joe Rogan a été produite à l’aide d’un système d’apprentissage profond de la synthèse vocale appelé RealTalk, qui, selon les développeurs, génère une parole réaliste en utilisant uniquement des entrées de texte.

Lire aussi : L’intelligence artificielle devient dangereusement bonne pour imiter les comportements humains

Source : The Mind Unleashed – Traduit par Anguille sous roche

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *