Catégories
Actualités rurales

Facebook AI peut traduire directement entre l'une des 100 langues

Par Chris Stokel-Walker

Image par défaut du nouveau scientifique

Facebook génère 20 milliards de traductions par jour

incamerastock / Alamy

Facebook a développé une intelligence artificielle capable de traduire avec précision entre n'importe quelle paire de 100 langues sans compter d'abord sur la traduction en anglais, comme le font de nombreux systèmes existants.

L'IA surpasse ces systèmes de 10 points sur une échelle de 100 points utilisée par les universitaires pour évaluer automatiquement la qualité des traductions automatiques. Les traductions produites par le modèle ont également été évaluées par des humains, qui ont obtenu une précision d'environ 90%.

Le système de Facebook a été formé sur un ensemble de données de 7,5 milliards de paires de phrases recueillies sur le Web dans 100 langues, bien que toutes les langues n'aient pas le même nombre de paires de phrases. «Ce qui m'intéressait vraiment, c'était de supprimer l'anglais comme intermédiaire. Dans le monde entier, il existe de nombreuses régions où ils parlent deux langues qui ne sont pas l'anglais », explique Angela Fan de Facebook AI, qui a dirigé le travail.

Publicité

Le modèle a été formé en se concentrant sur les langues qui sont communément traduites les unes vers les autres et entre elles, en regroupant les langues en 14 collections distinctes basées sur la géographie et les similitudes culturelles. Cela a été fait pour garantir une traduction de haute qualité des connexions les plus couramment utilisées et pour former le modèle avec plus de précision.

Pour certaines paires de langues, le nouveau système montre des améliorations significatives par rapport à la qualité de traduction existante. Par exemple, la traduction de l'espagnol vers le portugais est particulièrement intéressante car l'espagnol est la deuxième langue la plus parlée dans le monde, ce qui signifie que les chercheurs ont eu accès à une grande quantité de données sur la formation. La traduction entre l'anglais et le biélorusse s'est également améliorée par rapport aux efforts existants, car l'IA apprend en traduisant le russe, qui partage des similitudes avec le biélorusse.

Bien que le système ne soit pas encore utilisé sur le site de réseau social, Facebook prévoit de le mettre en œuvre prochainement pour gérer les 20 milliards de traductions effectuées chaque jour lorsque les gens cliquent sur "Traduire" sur des articles rédigés dans plus de 160 langues. Le travail futur sera fait sur d’autres langues, dit Fan, «en particulier pour les langues où nous ne disposons pas de beaucoup de données, comme les langues d’Asie du Sud-Est et d’Afrique».

Le travail «rompt avec les modèles centrés sur l'anglais et tente de créer des modèles multilingues plus diversifiés», explique Sheila Castilho du centre ADAPT du Trinity College de Dublin, en Irlande. "C'est rafraîchissant." Mais, dit Castilho, les évaluations humaines n'ont examiné qu'une petite fraction d'exemples, ce qui rend difficile de savoir s'il s'agit d'un jugement précis sur les performances de l'IA.

Elle craint également que l'évaluation ait été effectuée par des bénévoles bilingues plutôt que par des traducteurs professionnels. «Les non-professionnels manquent de connaissances en traduction et peuvent donc ne pas remarquer les différences subtiles qui rendent une traduction meilleure qu'une autre», dit-elle.

Son collègue du Centre ADAPT, Andy Way, suggère que Facebook ne fait pas une comparaison équitable avec les systèmes de traduction de pointe. «Leur prétention à une amélioration aussi importante par rapport aux modèles« centrés sur l’anglais »est un peu vide de sens, car la plupart du temps, les gens ne font plus cela», dit-il. Facebook n'est pas d'accord, affirmant que la traduction en anglais est toujours courante.

Référence du journal: Journal de recherche sur l'apprentissage automatique, dans la presse

En savoir plus sur ces sujets:

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *