Les langues africaines et asiatiques ignorées des technologies de reconnaissance vocale

Les pays dont les locuteurs et locutrices sont pauvres n’intéressent pas vraiment la Silicon valley.

L’enceinte connectée est la dernière tendance des gadgets technologiques. Google et Amazon, les deux plus gros vendeurs de ce type de produits, en commercialisent désormais à moins de cinquante euros, ce qui va vraisemblablement faire de l’Amazon Echo et du Google Home des cadeaux vedettes de Noël 2018.

Selon les prédictions d’une association de consommateurs américaine, vingt-deux millions d’enceintes connectées seront offertes sous les sapins cette année aux États-Unis. Les choses seront bien différentes sur d’autres continents: d’après une étude de Caribou Digital et du DFS Lab, les développeurs de technologies de reconnaissance vocale ne s’intéressent pas à certaines langues, notamment africaines et asiatiques.

S’ils ont récemment accompli de grandes avancées dans le domaine, les concepteurs crééent par la même occasion un fossé entre les langues. Car avec le développement des commandes vocales, il est probable que tout un écosystème reposant sur elles se créé. Écosystème auquel les locuteurs et locutrices d’une langue ignorée ne pourront pas prendre part.

Objectif profits

 

Les langues africaines et asiatiques sont laissées de côté principalement parce qu’elles sont parlées par des populations pauvres –les constructeurs voulant avant tout que leur technologie soit profitable. Les scientifiques auteurs de l’étude soulignent qu’en multipliant le nombre de locuteurs et locutrices par le PIB par tête, les 100 langages les plus usités du monde couvrent 96% du PIB global, alors qu’ils ne représentent que 60% de la population mondiale. Ce qui veut dire que 40% de la population parlent des langues qui ne représentent que des petits marchés.

Un autre obstacle au développement de ces technologies réside dans des bases de données insuffisantes. Même le kiswahili, parlé par plus 100 millions de personnes, n’a apparemment pas assez de données facilement accessibles. Pour créer un service qui permette d’interagir par la voix avec une machine, il faut approximativement 100.000 heures de dialogue enregistrées.

Repéré par Barthélemy Dont
Repéré sur Quartz
Source : Slate

Diffusion partielle ou totale interdite sans la mention : Source www.kassataya.com

Related Articles

Close
Close