Jeudi 16 novembre 2017
Nécessité d’investir le traitement automatique des langues
Les projets de kabylisation des outils numériques grand public lancés par la communauté kabylophone indépendamment des structures académiques ne pourront pas à eux seuls être une réponse au manque de visibilité de la langue de Mammeri sur le web ou les systèmes numériques en général.
A la frontière de l’informatique, la linguistique et l’intelligence artificielle, le domaine du traitement automatique des langages naturels (TAL) est une discipline qui permet d’automatiser certains traitement pour simplifier l’intégration du kabyle sur tous les outils faisant partis des disciplines modernes liées aux sciences de la langue dont :
-
Reconnaissance vocale ou de la parole, spectrogrammes, sonagrammes, outils de segmentation de la parole…etc., qui traitent des domaines de la phonétique et phonologie (son, phonème, syllabe et intonation).
-
Segmentateurs (tokenizers), racinisateurs, lemmatisateur, délimiteurs des éléments d’une phrase qui traitent du domaine de la morphologie et analyse lexicale (mots, affixes: préfixe et suffixe, genre grammatical, nombre grammatical, conjugaison et déclinaison).
-
Analyseurs syntaxiques et Chunkers qui traitent du domaine de la Syntaxe (phrase, proposition, groupe de mot, mot).
-
Désambiguïseurs des sens des mots et analyseurs des rôles sémantiques qui traitent du domaine de la sémantique (Prédicat, représentation logique, sens des mots).
-
Analyseurs d’émotion, outils de cohérences rhétorique et Outils de reconnaissance d’entités nommées qui traitent des domaines de la pragmatique, la théorie du discours, la rhétorique et la théorie des actes du langage (type du discours, genre, théorie de l’acte du langage, émotion).
Contrairement aux projets de localisation des interfaces des outils grand public dont les navigateurs web, les réseaux sociaux, des applications à usage divers (partage, collaboration, échange de données), systèmes d’exploitation…etc. qui ne nécessitent pas des compétences particulières de haut niveau si ce n’est la compréhension de la langue et les références lexicales adéquates (manuels, lexiques officiels…), les outils de traitement automatique des langues nécessitent des compétences hautement qualifiées et pluridisciplinaires sur le plan académique pour produire des outils de haute qualité.
Les départements de langue kabyle en kabylie ou ailleurs pourront se pencher d’avantage sur ces domaines car le monde où nous vivons tend vers la numérisation généralisée. Nous devenons de plus en plus dépendants de l’Internet, du PC et aujourd’hui s’ajoute le paramètre de la mobilité :
-
Services en ligne : Messagerie, météo, opérations bancaires, réservation d’hôtel, enseignement….
-
Interfaces vocales : Centre d’appels robotisés (assistance vocale), authentification vocale….
-
Authentification digital : Biométrie.
-
Traduction automatique,
-
Robotique…
Nos universités de Tizi-Ouzou, Béjaia et Bouira ne manquent pas de compétences si l’on se réfère aux publications riches en nombre et en qualité constatées ces dernières années dans le domaine des sciences du langage. Il est nécessaire aujourd’hui de créer des interfaces de collaboration entre les départements de langue kabyle et ceux des départements de l’informatique de ces mêmes universités pour lancer des projets de recherche ou de réalisation/développement en commun qui permettront une intégration rapide et plus scientifique du kabyle dans l’ère du numérique et guideront les contributeurs libres en dehors de l’universités à localiser davantage de systèmes, outils et applications en langue kabyle.
M. B.
Consultant ERP
Localisateur de systèmes numériques en langue kabyle
Email : belkacem77@gmail.com