Une I.A. est devenue bilingue sans dictionnaire !

bilingue sans dictionnaire

Des groupes de chercheurs français et espagnols ont pu traduire des textes sans avoir besoin d’une base de données bilingue. Il s’agit d’une prouesse unique en matière d’intelligence artificielle.

Nous sommes beaucoup à utiliser Google Traduction mais combien d’entre nous savent comment les débuts se sont déroulés. En réalité, le service s’est aidé des énormes bases de données contenant des documents bilingues, mises à disposition par l’ONU et du Parlement européen. Ensuite, une méthode statistique a été appliquée afin de mettre au point des modèles servant à faire d’autres traductions.

Il s’agit d’une méthode sujette aux critiques car comme chacun sait, les résultats obtenus avec Google Traduction sont parfois étranges. Cependant, Google a remplacé cette technique l’an dernier par un réseau neuronal capable de prendre en compte des ensembles de phrases et leur contexte en utilisant l’apprentissage automatique supervisé. Néanmoins, comme l’indique Science Magazine, les langues rares (ou peu traduites) sont le dernier rempart à une couverture totale.

Deux articles scientifiques récents témoignent de la concurrence de la technique d’apprentissage automatique supervisé. Le premier article (PDF en anglais/14 pages) est le fruit du travail de l’équipe d’Alexis Conneau, chercheur travaillant pour Facebook et le second a été diffusé par des chercheurs de l’Université de San Sebastian (Espagne).

Cette nouvelle méthode a recours à l’apprentissage non supervisé. Ainsi, il n’est plus question de se baser sur d’immenses sources de données dont la traduction repose d’abord sur l’humain. Il s’agit d’une méthode visant à comprendre la structure des langues, et ce sans aucune référence provenant de traducteurs humains.

« Imaginez que vous donniez à une personne plein de livres en chinois et en arabe, aucun n’étant le même. La personne doit apprendre à traduire du chinois en arabe sans aucun recoupement », a indiqué Mikel Artetxe, principal meneur de l’étude espagnole.

L’I.A. utilise quelques documents afin d’élaborer une sorte d’index des points communs entre deux langues et ainsi obtenir automatiquement des dictionnaires bilingues pour n’importe quelle langue. L’I.A. s’entraîne en pratiquant la traduction inverse, c’est-à-dire que cette dernière vérifie ses résultats en traduisant à nouveau le texte vers la langue d’origine. Ensuite, un travail de correction est assuré, par exemple, en supprimant quelques mots ou en arrangeant quelques phrases. L’opération est alors répétée jusqu’à l’obtention de la meilleure traduction possible.

Pour l’instant, les résultats obtenus restent inférieurs à ceux de Google Traduction mais l’apprentissage de l’I.A. pourrait être amélioré en incluant dans le programme plusieurs milliers de phrases bilingues, le but étant de faciliter le travail. Les progrès sont en cours et les chercheurs sont persuadés d’avoir mis la main sur un nouvel axe de recherche offrant de grandes promesses.

Sources : SciencePostScience Magazine01net

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *