L’Intelligence Artificielle est désormais au service des langues africaines, une prouesse technologique à mettre à l’actif des jeunes africains Bonaventure Dossou et Chris Emezue

Partager sur facebook
Partager sur google
Partager sur twitter
Partager sur linkedin
l'intelligence artificielle au service des langues africaines, par Bonaventure Dossu et Chris Emezue

Bonaventure Dossou et Chris Emezue sont les deux étudiants et chercheurs africains qui sont parvenus, grâce à l’intelligence Artificielle, à faire en sorte que les moteurs de recherches d’internet puissent parler et traduire leurs langues natales africaines, respectivement le Fongbe ou Fon du Bénin et l’Igbo du Nigeria.

C’est à travers le projet FFR mis sur pieds par les deux prodiges que ces derniers sont parvenus à mener des recherches sur le NLP africain (le traitement du Langage Naturel en Langues Africaines), étant donné que le Langage Naturel est l’une des branches de l’Intelligence Artificielle (IA) qui permette de comprendre les subtilités d’un langage humain en s’aidant des ordinateurs.

Comment y sont-ils parvenus quand on sait tous les défis qu’imposent le manque des données dus à la faible documentation des langues africaines ?

Recourir à l’intelligence Artificielle pour sauvegarder l’héritage culturel des langues africaines

L’écrivain Kényan Ngugi wa Thiong’o disait encore que « les intellectuels africains doivent faire pour leurs cultures et pour leurs langues ce que tous les intellectuels historiques du monde on fait pour les leurs… ».

C’est sur la base de cette grande réflexion, associée à certaines difficultés rencontrées au quotidien que les deux chercheurs Bonaventure Dossou et Chris Emezue ont compris la nécessité d’utiliser l’IA pour mettre en place un système de traduction moderne et efficace qui permettrait de traduire les langues africaines entre elles, mais aussi avec les langues occidentales.

En effet, Bonaventure Dossou se souvient que sa mère ne sait parler que le Fon, un dialecte populaire du Sud du Bénin que cette dernière n’est même pas capable d’écrire.

Lorsqu’elle lui envoyait des messages vocaux pour avoir de ses nouvelles, elle ne s’adressait à lui que dans cette langue, lui qui était parti depuis longtemps poursuivre ses études en Russie. Il comprenait, mais avait du mal avec certaines expressions et certaines subtilités de sa langue maternelle.

Il s’est très vite rendu compte que le célèbre Google translate ne proposait pas de traduction pour cette langue béninoise, du coup il devait tout le temps faire appel à sa sœur pour l’aider à bien comprendre les messages de sa mère.

Il cherche à s’améliorer, mais se rend vite compte qu’Il n’est pas possible d’améliorer son fon par l’étude, car les langues africaines sont surtout parlées et rarement documentées, c’est-à-dire qu’il existe peu, voire pas de livres pour en enseigner la grammaire et la syntaxe.

Bonaventure Dossou fait alors la rencontre de Chris Emezue, un ami nigérian qui rencontre les mêmes problèmes que lui avec sa langue, l’Igbo.

Les deux étudiants en Intelligence Artificielle commencent alors à faire des recherches pour développer un modèle de traduction des langues africaines par intelligence artificielle (IA), similaire à Google Translate, un projet qu’ils vont nommer FFR.

Le projet FFR, l’énorme défi des données

Il est impossible de parler d’Intelligence Artificielle sans évoquer la question cruciale d’un important volume de données à utiliser.

En clair, prétendre mettre au point des systèmes de traduction automatiques performants ne saurait être possible sans disposer de bases de données puissantes qui prendraient en compte les différents aspects ainsi que toutes les subtilités des langues à traduire.

Pour Bonaventure Dossou et Chris Emezue, leur projet les imposait donc de trouver une puissante base avec des données conséquentes et surtout pertinentes, ce qui semblait ‘’mission impossible’’, du fait que les langues et dialectes africains disposent de très peu de documentation.

Dès lors, le travail des deux chercheurs consiste dans un premier temps à rechercher autant de dictionnaires, de transcriptions écrites, d’expressions, et de vocabulaires que possible.

C’est pour concrétiser cette première étape que le projet FFR (Fon-French Neural Machine Translation) sera mis en place, permettant ainsi de collecter des données à grande échelle, notamment à travers le processus FFR Dataset, mais permettra également la création d’un système de traduction Fongbe – Français.

Dans le cadre de cette recherche, Bonaventure et Chris se sont servis de JW300 et BeninLangues comme principales sources de données.

Il faut noter que JW300 est un site des Témoins de Jéhovah Contenant de nombreux sermons et publications traduits dans plus d’une centaine de langues africaines.

De plus, le site officiel des témoins de Jéhovah, selon les derniers chiffres, est le plus traduit au monde, avec à son actif des millions de publications traduites dans plus de 1025 langues, dont les langues et dialectes africains.

Quant à BeninLangues (BL), il s’agit d’une riche base de données qui contient des expressions courtes, des proverbes, des mots de vocabulaire, des petites phrases, des phrases complètes, mais aussi des versets bibliques (Genèse 1 – Psaume 79) en langues béninoises.

En plus de ces sources fiables, les deux chercheurs ont pu compter sur la participation et la collaboration de plateformes comme Fabroni Bill YOCLOUNON et Ricardo AHOUANVLAME.

C’est donc suite à une minutieuse évaluation des traductions par des locuteurs natifs et des locuteurs bilingues que l’ensemble des données a été obtenu.

Sur la bonne voie…

Le projet de Bonaventure Dossou et Chris Emezue est certes encore en amélioration, mais les premiers résultats laissent paraître que les deux chercheurs spécialistes de l’IA sont sur la bonne voie.

En effet, la présentation qui en a été faite a fortement séduit les chercheurs des plus grandes institutions technologiques à l’instar de GoogleAI ou encore de DeepMind, tout en continuant de faire l’objet de bon nombre d’interviews et articles scientifiques.

Plus récemment encore, la crise sanitaire de la Covid-19 a empêché les deux amis de présenter leur innovation à l’ICLR, l’une des plus grandes conférences du monde sur l’IA.

L’édition 2020 de cette conférence devait normalement se tenir dans la capitale éthiopienne Addis-Abeba, qui aurait été la première ville africaine à accueillir cette conférence.

Génie d'afrique

Génie d'afrique

Information complète et en continu sur la technologie et science en Afrique.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Oser c'est avancé

Articles similaires