00000001.jpg

CHERCHER

Accueil Actualités Dépêches Coup de projecteur Manifestations Contact

Technologies de la Langue



Glossaires des outils linguistiques et applications de traitement automatique de l’information professionnelle

Les deux glossaires ci-dessous sont le résultat d’une étude sur « l’Etat de l’art des technologies linguistiques pour le traitement de l’information professionnelle », réalisée conjointement par le bureau Van Dijk et ELDA, avec le soutien de la Direction de la Technologie du Ministère de l’Education nationale, de la Recherche et de la Technologie (10 novembre 1999).

-  Glossaire des outils linguistiques de traitement automatique de l’information professionnelle

-  Glossaire des applications de traitement automatique de l’information professionnelle

A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z




L

Outils linguistiques de traitement automatique de l’information professionnelle

Langage contrôlé :

Langage qui a été conçu de manière à restreindre le nombre de mots et de structures linguistiques utilisés, afin de faciliter le traitement du langage ; le langage contrôlé est généralement employé par des personnes qui travaillent dans un domaine nécessitant une certaine précision de langage et une rapidité de réponse tels que les services de police et d’urgence, les pilotes d’avions, les aiguilleurs du ciel, etc.

Lemmatiseur :

Outil qui par l’étiquetage (ou la division) des unités lexicales d’un document permet de déterminer les formes canoniques qui leur sont associées

Lexique :

Recueil linguistique de mots auxquels sont associées des informations linguistiques.

Lexique de prononciation :

Dans un système de reconnaissance de la parole, liste de mots auxquels sont associées des informations phonétiques (prononciation).


Applications de traitement de l’information professionnelle

LAD :

Voir Lecture automatique de documents.

Lecture Automatique de Documents :

Application qui consiste à effectuer, en utilisant des algorithmes très évolués, la reconnaissance de caractères (typographiés ou manuscrits) à partir de leur image numérisée, de manière à fournir, en sortie, les codes informatiques de caractères reconnus nécessaires aux traitements futurs. Abréviation : LA