00000001.jpg

CHERCHER

Accueil Actualités Dépêches Coup de projecteur Manifestations Contact

Technologies de la Langue


Imprimer cet article

  Glossaires
mercredi 12 novembre 2003


Glossaires des outils linguistiques et applications de traitement automatique de l’information professionnelle

Les deux glossaires ci-dessous sont le résultat d’une étude sur « l’Etat de l’art des technologies linguistiques pour le traitement de l’information professionnelle », réalisée conjointement par le bureau Van Dijk et ELDA, avec le soutien de la Direction de la Technologie du Ministère de l’Education nationale, de la Recherche et de la Technologie (10 novembre 1999).

-  Glossaire des outils linguistiques de traitement automatique de l’information professionnelle

-  Glossaire des applications de traitement automatique de l’information professionnelle

A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z


Glossaire des outils linguistiques de traitement automatique de l’information professionnelle

Aide à l’acquisition de corpus oraux 
  Plate-forme pour l’enregistrement vocal avec des outils de traitement
Aligneur de corpus 
  Outil consistant à mettre en parallèle plusieurs versions linguistiques d’un corpus afin de pouvoir identifier les locutions, les expressions ou les termes équivalents.
Analyse de documents 
  Outil rendant possible la compréhension globale d’un document.
Analyseur morphologique
  Programme ou ensemble de programmes informatiques visant la reconnaissance des mots d’un texte d’après leur forme ou leur graphie.
Analyseur pragmatique 
  Programme ou ensemble de programmes informatiques permettant de déterminer le sens global d’un texte.
Analyseur sémantique 
  Programme ou ensemble de programmes informatiques visant à mettre évidence le sens d’un énoncé ou à représenter des structures de connaissances contenues dans un texte.
Analyseur syntaxique 
  Programme ou ensemble de programmes informatiques visant à analyser la structure (grammaticale) d’un texte.
Base de données terminologiques 
  Ensemble de mots organisés selon, par exemple, leur catégorie grammaticale, afin de permettre leur utilisation et leur traitement par un programme informatique d’analyse de texte.
Corpus 
  Recueil linguistique, de textes ou de paroles.
Correcteur grammatical
  Outil permettant de corriger la structure grammaticale d’un texte.
Correcteur orthographique / lexical 
  Outil permettant de corriger l’orthographe des mots d’un texte.
Correcteur stylistique 
  Programme qui corrige le style d’un texte. il élimine les répétitions, constate les mêmes ensembles de mots souvent présents dans le texte, signale les phrases trop longues, etc.
Dialogue Homme-Machine 
  Echange (écrit ou oral) interactif et alternatif d’informations entre une personne et une machine.
Etiqueteur morpho-syntaxique 
  Outil permettant d’ajouter ou d’associer des informations morphologiques et syntaxiques aux mots d’un corpus, d’un texte ou d’un document.
Etiqueteur prosodique 
  Outil permettant d’ajouter ou d’associer des informations prosodiques aux mots d’un corpus, d’un texte ou d’un document.
Etiqueteur sémantique 
  Outil permettant d’ajouter ou d’associer des informations sémantiques aux mots d’un corpus, d’un texte ou d’un document.
GED 
  Voir Gestion Electronique de Documents.
Générateur d’application 
  Interface graphique qui permet de générer une application sans développer un programme informatique (exemple : génération de l’arborescence/graphe d’un dialogue vocal homme-machine).
Génération de document multimodal 
  Création d’un nouveau document multimodal.
Génération de formes dérivées 
  Création automatique de formes dérivées
Génération de formes fléchies 
  Création automatique de formes fléchies
Génération de phrases 
  Création automatique de phrases
Génération de textes 
  Création automatique d’un texte en langue naturelle à partir d’informations stockées sur ordinateur.
Gestion Electronique de Documents 
  Ensemble de techniques permettant d’organiser, gérer et distribuer les informations sous une forme électronique.

Abréviation : GED.
Grammaire 
  Ensemble de règles qui expriment les relations et les contraintes entre les catégories de mots d’une phrase, indépendamment du sens de la phrase ou du sujet qui l’a produite.
Interface en LN 
  Interface utilisateur qui assure au moyen du langage naturel (oral ou écrit) le dialogue entre l’homme et la machine.
Langage contrôlé
  Langage qui a été conçu de manière à restreindre le nombre de mots et de structures linguistiques utilisés, afin de faciliter le traitement du langage ; le langage contrôlé est généralement employé par des personnes qui travaillent dans un domaine nécessitant une certaine précision de langage et une rapidité de réponse tels que les services de police et d’urgence, les pilotes d’avions, les aiguilleurs du ciel, etc.
Lemmatiseur 
  Outil qui par l’étiquetage (ou la division) des unités lexicales d’un document permet de déterminer les formes canoniques qui leur sont associées
Lexique 
  Recueil linguistique de mots auxquels sont associées des informations linguistiques.
Lexique de prononciation 
  Dans un système de reconnaissance de la parole, liste de mots auxquels sont associées des informations phonétiques (prononciation.
Mémoire de traduction
  Système qui utilise des traductions antérieures pour déduire de nouvelles traductions.
Outil d’analyse dérivationnelle 
  Analyseur morphologique s’appliquant aux formes dérivées.
Outil d’analyse flexionnelle 
  Analyseur morphologique s’appliquant aux formes fléchies.
Outil d’aide à la recherche d’informations 
  Outils permettant d’effectuer une recherche aux moyens de critères de sélection prédéfinis lors de l’utilisation d’un outil de recherche d’informations (cf. outil de recherche d’informations).
Outil de classement de documents 
  Système de classement qui permet un rangement thématique des documents.
Outil de classification de documents 
  Voir outil de classement de documents.
Outil de consolidation de terminologie 
  Outil permettant la mise à jour d’une terminologie existante.
Outil de correction automatique d’erreurs 
  Outil qui vérifie et corrige de manière automatique les erreurs de type grammatical, orthographique, stylistique, etc. d’un texte.
Outil de détection automatique d’erreurs 
  Outil d’aide à la rédaction
Outil de filtrage d’informations 
  Outil permettant, à partir d’un large volume d’informations, d’extraire et de présenter uniquement les mots, textes phrases, documents intéressant un utilisateur qui a préalablement décrit ses centres d’intérêt.
Outil de gestion et de reconnaissance de format électronique de documents 
  Outil capable d’identifier le format d’un document (.rtf, .doc, etc.)
Outil de localisation 
  Outil qui permet d’adapter un logiciel aux exigences locales en termes de langue et de culture (y compris la pratique légale et les accords commerciaux, par exemple)
Outil de post-édition automatique 
  Outil d’aide à la traduction dont la fonction principale est la relecture après la traduction-machine.
Outil de recherche d’informations 
  Outil permettant la création, le stockage et la recherche d’informations (recherche de mots, phrases, documents, sites Web, etc.).
Outil de segmentation de texte 
  Outil qui a pour but d’étiqueter (ou diviser) un document en différentes unités textuelles afin d’en faciliter l’identification (mots, mots composés, phrases, paragraphes, etc.).
Outil de statistiques lexicales 
  Outil permettant de calculer la fréquence d’apparition des termes significatifs d’un texte.
Outil de traduction vocale 
  Outil qui a pour but de traduire automatiquement des conversations spontanées.
Outil de vérification du locuteur 
  Outil permettant de vérifier l’adéquation du message vocal d’un locuteur avec la référence acoustique présumée conforme.
Outil d’extraction de terminologie 
  Outil qui permet l’élaboration complète d’une terminologie à partir d’une extraction automatique sur un corpus donné.
Outil d’extraction d’informations
  Alimentation des systèmes informatiques, en particulier des bases de données, à partir d’informations contenues dans des textes écrits. Voir aussi Outil de filtrage d’informations.
Outil d’identification de la langue 
  Outil qui détermine dans quelle langue un document est écrit (ou enregistré) et avec quel jeu de caractères il est encodé.
Outil d’identification du locuteur
  Outil permettant de déterminer l’identité d’une personne en comparant un message vocal avec un ensemble de références acoustiques.
Outil d’indexation de documents 
  Outil permettant de décrire et de caractériser le contenu de documents par des mots ou des expressions simples.
Phonétiseur 
  Outil d’étiquetage (morpho-syntaxique) permettant de faciliter la conversion graphème-phonème des unités lexicales identifiées.
Prédicteur de traduction 
  Outil d’aide à la traduction qui réalise à partir des éléments déjà traduits une traduction.
Prédicteur lexical 
  Outil d’aide à la rédaction qui prédit des parties de mots dès qu’il n’y a plus d’ambiguïté, et cela même s’il n’appartient pas au lexique, ou si le mot est erroné.
Recherche d’informations 
  Ensemble des outils linguistiques permettant de rechercher des informations.
Reconnaissance automatique de la parole 
  Elle concerne l’identification et l’interprétation du message vocal par une machine.
Reconnaissance de caractères imprimés 
  Procédé qui transforme l’image en mode point d’un texte imprimé en code textuel, la rendant donc lisible par une machine.
Reconnaissance de caractères manuscrits 
  Procédé qui transforme l’image en mode point d’un texte manuscrit en code textuel, la rendant donc lisible par une machine.
Ressource linguistique 
  Ensembles de données et de descriptions linguistiques en format électronique, utilisées essentiellement pour développer, améliorer et évaluer des algorithmes ou des systèmes de traitement de la langue. On distingue les lexiques, les dictionnaires, les grammaires, les bases de données terminologiques.
SGT 
  Voir Systèmes de Gestion de Terminologie.
Synthèse de la parole 
  La parole est synthétisée à partir de modèles complétés par des fragments préenregistrés ou par concaténation d’éléments de parole (phonèmes, mots). L’accent doit être mis sur l’intensité, la durée et l’intonation de la parole ainsi synthétisée afin d’obtenir un flux continu et naturel.
Système d’analyse et de manipulation du signal 
  Système permettant d’enregistrer et d’écouter de la parole, de calculer et de visualiser des spectrogrammes, de filtrer le signal, d’étiqueter les données orales, de calculer et de visualiser la prosodie.
Système de Compréhension du LN 
  Compréhension de requêtes exprimées en langage naturel.
Système de dictée vocale 
  Système qui décrypte une parole naturelle qui enchaîne les phonèmes, et la retranscrit avec une grammaire et une orthographe les plus proches possibles du message dicté.
Système de réaccentuation automatique 
  Outil d’aide à la rédaction qui outil qui réintroduit automatiquement les accents et autres marques diacritiques dans un texte qui en est privé.
Système de résumé automatique 
  Outil permettant de produire automatiquement une description concise d’un document couvrant l’intégralité de son contenu.
Système de routage de documents 
  Système permettant le routage de documents (cf. routage de l’information) grâce à une interconnexion de plusieurs liaisons (réseau d’utilisateurs expéditeurs/destinataires).
Système de Traduction Assistée par Ordinateur (ou semi-automatique)
  Processus consistant à aider un traducteur humain à traduire d’une langue vers une autre au moyen d’outils logiciels.
Système de traduction automatique
  Processus consistant à traduire automatiquement d’une langue vers une autre à l’aide d’un ordinateur.
Système de Traduction semi-automatique
  Voir Système de Traduction Assistée par Ordinateur.
Systèmes de Gestion de Terminologie 
  Logiciel permettant d’introduire les données terminologiques, de les mettre à jour et d’y accéder.
Abréviation : SGT.
Traitement de texte avancé 
  Traitement de texte avec des fonctionalités telles que la prédiction lexicale, la correction de style, etc.



Glossaire des applications de traitement de l’information professionnelle

Aide à l’édition 
  Outil permettant à un utilisateur de superviser un édition.
Aide à la rédaction 
  Moyens fournis parallèlement au traitement de texte en vue d’aider l’auteur d’un texte, incluant généralement un dictionnaire et un thesaurus en ligne, des vérificateurs orthographiques, grammaticaux et stylistiques et des outils de structuration, d’intégration et de interconnexion de documents.
Aide à la traduction 
  Outil permettant à un utilisateur de superviser une traduction.
Analyse de contenu 
  Programme ou ensemble de programmes informatiques visant la reconnaissance du contenu d’un texte.
Authentification de la personne et de l’origine des données 
  Preuve de l’identité d’une personne ou de l’origine des données.
Cartographie des données 
  Moyen d’accéder au contenu d’une base de données dont on ignore la teneur exacte en la visualisant sous forme de graphes de concepts, parmi lesquels pourront être choisis les termes de la requête.
Commandes vocales de l’édition 
  Gestion de l’édition par la voix.
Commandes vocales de l’environnement de rédaction 
  Gestion de l’environnement informatique par la voix.
Compression de données 
  Ensemble des moyens mis en œuvre pour réduire la quantité de signaux nécessaire au stockage ou à la transmission des données.
Confidentialité de l’information 
  Protection des données contre une prise de connaissance par un tiers non autorisé.
Contrôle de cohérence du texte 
  Vérification de la cohérence de l’information d’un texte donnée (cohérence stylistique, contextuelle, etc.)
Correction grammaticale 
  Correction de la grammaire des mots dans un document.
Correction orthographique 
  Correction de l’orthographe des mots dans un document.
Correction stylistique 
  Correction du style d’un texte.
Dictée vocale 
  Processus de reconnaissance automatique d’un texte et incorporation de traitement de texte.
Diffusion sélective de l’information 
  Processus qui consiste à envoyer à intervalles réguliers l’ensemble des références nouvelles répondant à une requête préalablement enregistrée.
Abréviation : DSI.
DSI 
  Voir Diffusion sélective de l’information.
Echange de données informatisées 
  Echange, entre des systèmes d’information et par des moyens électroniques, de données structurées suivant des normes préétablies de messages.
Abréviation : EDI.
EDI 
  Voir Echange de données informatisées.
Filtrage d’informations 
  Processus permettant, à partir d’un large volume d’informations dynamiques, d’extraire et de présenter les seuls documents intéressant pour un utilisateur qui a préalablement décrit ses centres d’intérêt
Gestion de documents 
  Processus permettant d’introduire des documents, de les mettre à jour et d’y accéder.
IAO 
  Voir Indexation Assistée par Ordinateur.
Indexation Assistée par Ordinateur 
  Description et caractérisation du contenu de documents par des mots oudes expressions simples, réalisée par une personne avec l’aide de la machine.
Abréviation : IAO.
Indexation automatique 
  Description et caractérisation du contenu de documents par des mots ou des expressions simples, sans intervention humaine.
Intégrité de l’information 
  Preuve de la non-modification de l’information.
LAD 
  Voir Lecture automatique de documents.
Lecture Automatique de Documents 
  Application qui consiste à effectuer, en utilisant des algorithmes très évolués, la reconnaissance de caractères (typographiés ou manuscrits) à partir de leur image numérisée, de manière à fournir, en sortie, les codes informatiques de caractères reconnus nécessaires aux traitements futurs.
Abréviation : LAD.
Messagerie 
  Service géré par ordinateur fournissant aux utilisateurs habilités les fonctions de saisie, de distribution et de consultation différée de messages, notamment écrits, graphiques ou sonores.
Numérisation des documents 
  La numérisation consiste, au moyen d’un scanner, d’une tablette de reconnaissance de l’écriture, etc., à transformer une représentation de l’information déjà existante sous forme analogique (papier, microfiche, etc.) en une représentation numérique.
Pertinence 
  En parlant d’une réponse, qui a rapport à la question, à la requête.
Recherche d’information (présentation de l’information) 
  Terme générique désignant généralement l’accès à des données et l’obtention d’informations, par un moyen quelconque, en provenance de bases de données de langage naturel
Reconnaissance de formats de documents 
  Procédé permettant l’identification du format d’un document (.rtf, .doc, etc.)
Reconnaissance optique de caractères manuscrits 
  Procédé qui transforme l’image en mode point d’un texte manuscrit en code textuel, la rendant donc lisible par une machine.
Reconnaissance optique de caractères typographiés 
  Procédé qui transforme l’image en mode point d’un texte imprimé en code textuel, la rendant donc lisible par une machine.
Résumé automatique 
  Extraction de l’information essentielle d’un texte d’entrée pour construire à partir de cette information, un nouveau texte de sortie, condensé.
Routage de l’information 
  Processus qui permet d’envoyer de l’information vers la bonne destination
Serveur d’informations en ligne 
  Serveur sur lequel les utilisateurs peuvent visualiser, récupérer… des documents par des moyens variés (FTP anonyme, Gopher, WAIS, WWW, annuaires…)
Synthèse 
  Ensemble des règles qui président à la formation de phrases à partir d’éléments fondamentaux du langage, c’est-à-dire les morphèmes, les mots et les parties du discours
TAO 
  Voir Traduction assistée par Ordinateur.
Traduction Assistée par Ordinateur 
  Processus de traduction qui ne peut se dérouler sans intervention humaine.
Traduction automatique 
  Traduction de textes d’une langue maternelle à une autre, sans intervention humaine en cours de traitement.
Traduction simultanée (Speech to speech) 
  Système permettant à une personne de converser de façon spontanée, par téléphone, avec un interlocuteur ne parlant pas la même langue. Le message de cette personne serait automatiquement traduit dans la langue de son interlocuteur.
Traduction vocale 
  Processus permettant la traduction orale d’une communication orale par l’intermédiaire d’un module de reconnaissance de la parole, en passant par un module de traduction vers un module de synthèse vocale.
Vérification de la personne 
  Il s’agit de confirmer ou d’infirmer que le locuteur est bien celui qu’il prétend être.
Vérification grammaticale 
  Processus qui permet de vérifier la grammaire d’un texte donné.
Vérification orthographique 
  Processus qui permet la vérification de l’orthographe des mots.
Vérification stylistique 
  Logiciel qui examine un document pour s’assurer qu’il correspond à une structure type du texte et du document qui le renferme ; désigne également la vérification de l’emploi des locutions ou des phrases d’une manière prédéfinie
Workflow 
  Système de gestion électronique de processus qui permet d’automatiser la circulation des flux d’informations (dans une entreprise, par exemple).