Copyright de l’image Bonaventure Dosou Image caption Bonaventure Dossou travaille sur un modèle d'IA pour aider à traduire le fon en français

Elle lui envoie souvent des messages vocaux en fon, une langue béninoise, alors qu'il est parti étudier en Russie. Il ne comprend cependant pas certaines des phrases qu'elle utilise.

"Ma mère ne sait pas écrire le fon et je ne parle pas très bien cette langue, mais je parle couramment le français", a déclaré M. Dossou à la BBC.

"Je demande souvent à ma sœur de m'aider à comprendre certaines des phrases que ma mère utilise", a-t-il dit.

Il n'est pas question d'améliorer son fon par l'étude car, comme des centaines d'autres langues africaines, il est surtout parlé et rarement documenté, de sorte qu'il existe peu, voire pas, de livres pour enseigner la grammaire et la syntaxe.

Poussés par la curiosité et alimentés par des données collectées sur le fon grâce à une bible des Témoins de Jéhovah, M. Dossou et Chris Emezue, un ami nigérian, ont développé un modèle de traduction de langue par intelligence artificielle (IA), similaire à Google Translate, qu'ils ont nommé FFR.

Ils travaillent encore à améliorer leur invention.

Les deux étudiants font partie de plusieurs chercheurs en IA qui utilisent les langues africaines dans le traitement du langage naturel (NLP), une branche de l'IA utilisée pour enseigner et aider les ordinateurs à comprendre les langues humaines.

Si le monde ne s'était pas arrêté à la suite de la pandémie de Covid-19, MM. Dossou et Emezue auraient présenté leur création à des centaines de participants lors de l'une des plus grandes conférences sur l'IA au monde, l'ICLR, qui s'est tenue cette semaine à Addis-Abeba, la capitale éthiopienne.

C'était la première fois que l'événement se tenait en Afrique.

Au lieu d'annuler l'événement, les organisateurs ont décidé de le tenir virtuellement.

Les innovations en matière d'IA ont été désignées comme le moteur de la "quatrième révolution industrielle" qui apportera des changements radicaux dans presque tous les aspects de notre vie, y compris dans notre façon de travailler.

Certains analystes ont qualifié de nouveau pétrole les big data qui alimentent les systèmes d'IA.

Pour l'instant, l'Afrique est considérée comme perdante dans le rôle qu'elle joue dans la construction de l'avenir de l'IA, car la majorité des 2 000 langues du continent, selon les estimations, sont classées comme "à faibles ressources", ce qui signifie qu'il y a un manque de données à leur sujet et/ou que ce qui est disponible n'a pas été indexé et stocké dans des formats qui peuvent être utiles.

Combler le fossé linguistique

Copyright de l’image Bonaventure Dossou Image caption M. Dossou (L) et M. Emezue (R) espèrent développer leur projet en Afrique

Les langues africaines ne sont pas prises en compte lors de la création d'applications de PNA comme les assistants vocaux, les logiciels de reconnaissance d'images, les systèmes d'alerte de trafic et autres.

Mais les chercheurs africains s'efforcent d'éliminer ce handicap.

"Nous nous efforçons de placer l'Afrique sur la carte de la recherche en PNL et en IA", a déclaré à la BBC le Dr Ignatius Ezeani, de l'Université de Lancaster.

"Si vous ne mettez pas vos ressources linguistiques à la disposition du public, gratuitement et ouvertement, les chercheurs n'auront pas les données nécessaires pour trouver des solutions créatives. Nous devrons toujours dépendre de, disons, Google pour déterminer l'orientation de la recherche", a déclaré le Dr Ezeani.

La conférence en Éthiopie devait être un événement important pour les chercheurs africains qui, entre autres difficultés, se sont vus refuser des visas pour assister à des conférences de l'ICLR tenues aux États-Unis et au Canada, ce qui les a tenus à l'écart des conversations mondiales sur l'IA.

Lire aussi

"Le fait que la conférence n'ait pas eu lieu à Addis a été un coup dur, cela aurait entraîné un changement massif dans la diversité de la conférence", a déclaré à la BBC Jade Abbott, fondatrice de Masakhane, un mouvement de recherche pour la traduction automatique des langues africaines.

Masakhane, qui signifie "Nous construisons ensemble" en isiZulu, compte 150 membres dans 20 pays africains. Son adhésion est ouverte à tous ceux qui s'intéressent à la traduction des langues.

"Nous construisons une communauté de personnes qui se soucient des langues africaines et qui sont désireuses de construire des modèles de traduction. 30% des langues du monde sont africaines, alors pourquoi n'avons-nous pas 30% des publications de la PNL ? a demandé Mme Abbott.

Le réseau se concentre sur la promotion de la traduction des langues pour les Africains par les Africains et encourage le partage gratuit des ressources et la collaboration pour aider les chercheurs à s'appuyer sur les travaux des autres.

Toutefois, la plupart du temps, il s'agit de repartir de zéro.

Un chercheur affilié à Masakhane, par exemple, recueille actuellement des données auprès de locuteurs du damara, une langue khoisane - célèbre pour son cliquetis - en Namibie, a déclaré Mme Abbott.

Jusqu'à présent, les membres de Masakhane ont effectué 35 traductions de 25 langues africaines, a-t-elle ajouté.

Outre Masakhane, il existe d'autres initiatives visant à créer et à renforcer les réseaux de chercheurs en IA sur le continent :

Deep Learning Indaba, qui promeut l'IA en Afrique et organise une conférence annuelle

Data Science Africa, qui relie les chercheurs du continent

BlackinAI, une initiative qui promeut l'inclusion des personnes noires dans le domaine de l'intelligence artificielle

Le Dr Ezeani les appelle les "luttes silencieuses" des Africains travaillant dans le domaine de l'IA.

Il considère que ces engagements contribuent à développer les capacités du continent, tant en termes de construction d'infrastructures d'IA que de compétences des chercheurs et des développeurs.

"C'est essentiel non seulement pour la reconnaissance mais aussi pour relever les défis locaux, par exemple en matière de santé, d'agriculture, d'éducation et de gouvernance, avec des solutions locales et ciblées", a-t-il déclaré.

"Peut-être pouvons-nous aussi nous approprier et contrôler le discours à un moment donné", a-t-il ajouté.

Hé Alexa, tu parles Igbo ?

Copyright de l’image Ignatius Ezeani Image caption Le Dr Ezeani travaille sur un projet de traduction automatique de l'igbo vers l'anglais

Le Dr Ezeani travaille actuellement sur une traduction automatique de la langue igbo du Nigeria vers l'anglais.

"Dans cinq à dix ans, je pense être capable d'interagir avec Alexa en Igbo ou dans n'importe quelle langue, ce qui sera un exploit énorme et vraiment satisfaisant", a déclaré le Dr Ezeani.

Actuellement, aucun des assistants vocaux des principaux acteurs du marché mondial, Alexa d'Amazon, Siri d'Apple et Google Home, ne fonctionnent en langue africaine. Google Translate est activé pour 13 langues africaines, dont l'igbo, mais il est loin d'être parfait.

Le Dr Ezeani a déclaré que le travail que lui et d'autres font pourrait inciter les entreprises technologiques à intégrer les langues africaines dans leurs appareils.

Il met toutefois en garde contre le fait que les chercheurs africains travaillant dans le domaine de l'IA doivent être animés par des idées originales "qui sont réellement utiles aux gens" et ne pas poursuivre des projets vains.

"Nous pouvons vérifier si, par exemple, la traduction de l'igbo vers le yoruba et vice-versa est réellement plus utile que l'igbo vers l'anglais ; ou si les systèmes de parole ou de visuel vers le texte sont plus nécessaires que le texte vers le texte", a-t-il déclaré.

Quant à M. Dossou et son co-inventeur, M. Emezue, ils ont de grandes ambitions pour le FFR s'ils peuvent obtenir un financement.

Ils considèrent que le fon, une langue bantoue parlée par plus de deux millions de personnes au Bénin, ainsi que dans certaines régions du Nigeria et du Togo, les aidera à développer leur travail sur d'autres marchés.

Le fon fait partie de la famille des langues Niger-Congo, ce qui signifie qu'il partage une lignée ancestrale commune, avec des langues parlées dans certaines parties de l'Afrique occidentale, centrale, orientale et australe.

Mais pour l'instant, leur objectif est de continuer à former les FFR pour qu'ils puissent mieux traduire les conversations quotidiennes.

"Peut-être que dans un an environ, les messages de ma mère en fon seront traduits en français", a déclaré M. Dossou.