Chine : Le géant technologique Baidu développe une IA capable de cloner n’importe quelle voix en quelques secondes


Les chercheurs de Baidu ont créé une IA qui, selon eux, peut cloner votre voix en moins d’une minute. Deep Voice est un système de synthèse texte-parole formé par Baidu en utilisant 800 heures d’audio venant de 2 400 orateurs. Bien que le système ait généralement besoin de 100 sections de 5 secondes d’entraînement vocal pour imiter une voix, un échantillon de 5-10 secondes était suffisant pour tromper un système de reconnaissance vocale plus de 95 % du temps.

Deep Voice est capable de générer de nouvelles voix, accents, tonalités et styles. Par exemple, il est capable de changer une voix féminine en voix masculine et un accent britannique en accent américain. “D’un point de vue technique, il s’agit d’une percée importante montrant qu’un problème complexe de modélisation générative, la synthèse de la parole, peut être adapté à de nouveaux cas en apprenant efficacement à partir de quelques exemples”, explique Leo Zou, membre de l’équipe de communication de Baidu. “Auparavant, il fallait de nombreux exemples pour qu’un modèle apprenne. Maintenant, il faut une fraction de ce qu’il avait l’habitude de faire.”

“Nous voyons beaucoup de cas d’utilisation ou d’applications pour cette technologie”, a dit M. Zou. “Par exemple, le clonage de la voix pourrait aider les patients qui ont perdu leur voix. Il s’agit également d’une percée importante dans la direction des interfaces homme-machine personnalisées. Par exemple, une maman peut facilement configurer un lecteur de livres audio avec sa propre voix. La méthode [en outre] permet la création de contenu numérique original. Des centaines de personnages d’un jeu vidéo pourraient avoir des voix uniques grâce à cette technologie. Une autre application intéressante est la traduction de la parole à la parole, car le synthétiseur peut apprendre à imiter l’identité du locuteur dans une autre langue.”

Les technologies comme Deep Voice représentent le progrès rapide de l’apprentissage machine. Cependant, certains craignent que le système puisse être utilisé à mauvais escient pour fabriquer des interviews, des segments de nouvelles et des conférences de presse. Avec l’inquiétude que cette nouvelle technologie de clone mène à encore plus de fake news, espérons qu’elle ne tombe pas entre de mauvaises mains.

Source : TruthTheory

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *