Cette IA de Facebook est capable de traduire quelque chose dans 200 langues différentes

Temps de lecture : 2 minutes

Mise à jour le 7 juillet, 2022 par Metaverse

L’entreprise technologique a publié le code ouvert de l’outil afin que les chercheurs qui le souhaitent puissent le tester.
Meta, la société propriétaire de Facebook, WhatsApp et Instagram, a annoncé le développement de NLLB-200, un modèle basé sur l’intelligence artificielle (IA), capable de traduire dans 200 langues différentes, y compris des langues telles que Kambra, Lao ou Igbo. , qui est parlé dans différents pays africains.

Des chercheurs de la division IA de l’entreprise technologique ont développé ce système dans le cadre de l’initiative “No Language Left Behind” (NLLB), avec laquelle il cherche à créer des fonctions avancées de traduction automatique pour la plupart des langues du monde.
Plus précisément, NLLB-200 peut traduire dans 200 langues qui soient n’existaient pas jusqu’à présent dans les outils de traduction les plus utilisés, soit ne fonctionnaient pas correctement, selon l’entreprise dans un communiqué.

Meta a mis en évidence ces lacunes en indiquant que moins de 25 langues africaines sont incluses dans les traducteurs actuels ; un problème qu’elle tente de résoudre avec ce modèle qui comprend 55 langues africaines.

La société a mis en open source le modèle NLLB-200 et d’autres outils afin que d’autres chercheurs puissent étendre ce travail à davantage de langages et concevoir des technologies plus inclusives.

Avec cela, il a annoncé vouloir accorder des subventions allant jusqu’à 200 000 dollars à des organisations à but non lucratif qui souhaitent appliquer cette nouvelle technologie dans des environnements réels. De cette façon, il pense que ces avancées pourront fournir plus de 25 millions de traductions par jour dans la section des nouvelles de Facebook, Instagram et le reste des plateformes contrôlées par la technologie.

Cela peut vous intéresser :   Google Maps introduit deux nouvelles couches avec des informations sur les incendies actifs et la qualité de l'air

Avec cet engagement envers le modèle NLLB-200, Meta espère également proposer des traductions précises qui peuvent aider à détecter les contenus préjudiciables et la désinformation, ainsi qu’à protéger l’intégrité des processus politiques tels que les élections ou à arrêter les cas d’exploitation sexuelle et de traite des êtres humains sur Internet. .

Problèmes de système

Après avoir présenté ce modèle d’IA, Meta a mentionné quels sont les défis auxquels ils ont dû faire face pour développer leur nouveau modèle NLLB-200. En premier lieu, vous avez rappelé que ces services sont entraînés avec des données, un entraînement qui consiste en des millions de phrases appariées entre des combinaisons d’autres langues.

Le problème est qu’il existe de nombreuses combinaisons pour lesquelles il n’y a pas de phrases parallèles pouvant servir de traductions, ce qui signifie que certaines de ces traductions comportent des erreurs grammaticales ou des incohérences.

Meta a souligné qu’une autre grande difficulté consiste à optimiser un seul modèle afin qu’il fonctionne avec différentes langues sans nuire ni compromettre la traduction.

De plus, il a souligné que ces modèles de traduction produisent des erreurs difficiles à identifier et, comme il y a moins d’ensembles de données pour les langues avec moins de ressources, il est complexe de les tester et de les améliorer.

Metaverse
Écolo-engagée, amoureuse de la communication 2.0. Je suis chargée de marketing digital. Ma passion depuis toujours : l’écriture ! Ce métier s’est donc manifesté comme une évidence. Depuis mon plus jeune âge, j’adore enquêter, trouver des informations que d’autres n’ont pas, et la lecture tient également une place importante dans mon cœur. Passionné depuis toute petite par l’écriture et de nature très curieuse, je m’intéresse à tous les sujets !