Les deux glossaires ci-dessous sont le résultat d’une étude sur « l’Etat de l’art des technologies linguistiques pour le traitement de l’information professionnelle », réalisée conjointement par le bureau Van Dijk et ELDA, avec le soutien de la Direction de la Technologie du Ministère de l’Education nationale, de la Recherche et de la Technologie (10 novembre 1999).
Aide à l’acquisition de corpus oraux
|
|
Plate-forme pour l’enregistrement vocal avec des outils de
traitement
|
Aligneur de corpus
|
|
Outil consistant à mettre en parallèle plusieurs
versions linguistiques d’un corpus afin de pouvoir
identifier les locutions, les expressions ou les termes
équivalents.
|
Analyse de documents
|
|
Outil rendant possible la compréhension globale d’un
document.
|
Analyseur morphologique
|
|
Programme ou ensemble de programmes informatiques visant la
reconnaissance des mots d’un texte d’après leur forme ou
leur graphie.
|
Analyseur pragmatique
|
|
Programme ou ensemble de programmes informatiques permettant de
déterminer le sens global d’un texte.
|
Analyseur sémantique
|
|
Programme ou ensemble de programmes informatiques visant à
mettre évidence le sens d’un énoncé ou à
représenter des structures de connaissances contenues dans
un texte.
|
Analyseur syntaxique
|
|
Programme ou ensemble de programmes informatiques visant à
analyser la structure (grammaticale) d’un texte.
|
Base de données terminologiques
|
|
Ensemble de mots organisés selon, par exemple, leur
catégorie grammaticale, afin de permettre leur utilisation
et leur traitement par un programme informatique d’analyse de
texte.
|
Corpus
|
|
Recueil linguistique, de textes ou de paroles.
|
Correcteur grammatical
|
|
Outil permettant de corriger la structure grammaticale d’un texte.
|
Correcteur orthographique / lexical
|
|
Outil permettant de corriger l’orthographe des mots d’un texte.
|
Correcteur stylistique
|
|
Programme qui corrige le style
d’un texte. il élimine les répétitions,
constate les mêmes ensembles de mots souvent présents
dans le texte, signale les phrases trop longues, etc.
|
Dialogue Homme-Machine
|
|
Echange (écrit ou oral) interactif et alternatif
d’informations entre une personne et une machine.
|
Etiqueteur morpho-syntaxique
|
|
Outil permettant d’ajouter ou d’associer des informations
morphologiques et syntaxiques aux mots d’un corpus, d’un texte ou
d’un document.
|
Etiqueteur prosodique
|
|
Outil permettant d’ajouter ou d’associer des informations
prosodiques aux mots d’un corpus, d’un texte ou d’un document.
|
Etiqueteur sémantique
|
|
Outil permettant d’ajouter ou d’associer des informations
sémantiques aux mots d’un corpus, d’un texte ou d’un
document.
|
GED
|
|
Voir Gestion Electronique de Documents.
|
Générateur d’application
|
|
Interface graphique qui permet de générer une
application sans développer un programme informatique
(exemple : génération de l’arborescence/graphe d’un
dialogue vocal homme-machine).
|
Génération de document multimodal
|
|
Création d’un nouveau document multimodal.
|
Génération de formes dérivées
|
|
Création automatique de formes dérivées
|
Génération de formes fléchies
|
|
Création automatique de formes fléchies
|
Génération de phrases
|
|
Création automatique de phrases
|
Génération de textes
|
|
Création automatique d’un texte en langue naturelle à
partir d’informations stockées sur ordinateur.
|
Gestion Electronique de Documents
|
|
Ensemble de techniques permettant d’organiser, gérer
et distribuer les informations sous une forme électronique.
Abréviation : GED.
|
Grammaire
|
|
Ensemble de règles qui expriment les relations et les
contraintes entre les catégories de mots d’une phrase,
indépendamment du sens de la phrase ou du sujet qui l’a
produite.
|
Interface en LN
|
|
Interface utilisateur qui
assure au moyen du langage naturel (oral ou écrit) le
dialogue entre l’homme et la machine.
|
Langage contrôlé
|
|
Langage qui a été conçu de manière à
restreindre le nombre de mots et de structures linguistiques
utilisés, afin de faciliter le traitement du langage ; le
langage contrôlé est généralement
employé par des personnes qui travaillent dans un domaine
nécessitant une certaine précision de langage et une
rapidité de réponse tels que les services de police
et d’urgence, les pilotes d’avions, les aiguilleurs du ciel, etc.
|
Lemmatiseur
|
|
Outil qui par l’étiquetage (ou la division) des
unités lexicales d’un document permet de déterminer
les formes canoniques qui leur sont associées
|
Lexique
|
|
Recueil linguistique de mots auxquels sont associées des
informations linguistiques.
|
Lexique de prononciation
|
|
Dans un système de reconnaissance de la parole, liste de
mots auxquels sont associées des informations phonétiques
(prononciation.
|
Mémoire de traduction
|
|
Système qui utilise des traductions antérieures pour
déduire de nouvelles traductions.
|
Outil d’analyse dérivationnelle
|
|
Analyseur morphologique s’appliquant aux formes dérivées.
|
Outil d’analyse flexionnelle
|
|
Analyseur morphologique s’appliquant aux formes fléchies.
|
Outil d’aide à la recherche d’informations
|
|
Outils permettant d’effectuer une recherche aux moyens de
critères de sélection prédéfinis lors
de l’utilisation d’un outil de recherche
d’informations (cf. outil de recherche d’informations).
|
Outil de classement de documents
|
|
Système de classement qui permet un rangement thématique
des documents.
|
Outil de classification de documents
|
|
Voir outil de classement de documents.
|
Outil de consolidation de terminologie
|
|
Outil permettant la mise à jour d’une terminologie
existante.
|
Outil de correction automatique d’erreurs
|
|
Outil qui vérifie et corrige de manière automatique
les erreurs de type grammatical, orthographique, stylistique, etc.
d’un texte.
|
Outil de détection automatique d’erreurs
|
|
Outil d’aide à la rédaction
|
Outil de filtrage d’informations
|
|
Outil permettant, à partir d’un large volume
d’informations, d’extraire et de présenter
uniquement les mots, textes phrases, documents intéressant
un utilisateur qui a préalablement décrit ses
centres d’intérêt.
|
Outil de gestion et de reconnaissance de format électronique
de documents
|
|
Outil capable d’identifier le format d’un document (.rtf, .doc,
etc.)
|
Outil de localisation
|
|
Outil qui permet d’adapter un logiciel aux exigences locales
en termes de langue et de culture (y compris la pratique légale
et les accords commerciaux, par exemple)
|
Outil de post-édition automatique
|
|
Outil d’aide à la traduction dont la fonction
principale est la relecture après la traduction-machine.
|
Outil de recherche d’informations
|
|
Outil permettant la création, le stockage et la recherche
d’informations (recherche de mots, phrases, documents, sites
Web, etc.).
|
Outil de segmentation de texte
|
|
Outil qui a pour but d’étiqueter (ou diviser) un
document en différentes unités textuelles afin d’en
faciliter l’identification (mots, mots composés,
phrases, paragraphes, etc.).
|
Outil de statistiques lexicales
|
|
Outil permettant de calculer la fréquence d’apparition des
termes significatifs d’un texte.
|
Outil de traduction vocale
|
|
Outil qui a pour but de traduire automatiquement des conversations
spontanées.
|
Outil de vérification du locuteur
|
|
Outil permettant de vérifier l’adéquation du message
vocal d’un locuteur avec la référence acoustique
présumée conforme.
|
Outil d’extraction de terminologie
|
|
Outil qui permet l’élaboration complète d’une
terminologie à partir d’une extraction automatique sur un
corpus donné.
|
Outil d’extraction d’informations
|
|
Alimentation des systèmes informatiques, en particulier des
bases de données, à partir d’informations
contenues dans des textes écrits.
Voir aussi Outil de filtrage d’informations.
|
Outil d’identification de la langue
|
|
Outil qui détermine dans quelle langue un document est
écrit (ou enregistré) et avec quel jeu de caractères
il est encodé.
|
Outil d’identification du locuteur
|
|
Outil permettant de déterminer l’identité d’une
personne en comparant un message vocal avec un ensemble de
références acoustiques.
|
Outil d’indexation de documents
|
|
Outil permettant de décrire et de caractériser le
contenu de documents par des mots ou des expressions simples.
|
Phonétiseur
|
|
Outil d’étiquetage (morpho-syntaxique) permettant de
faciliter la conversion graphème-phonème des unités
lexicales identifiées.
|
Prédicteur de traduction
|
|
Outil d’aide à la traduction qui réalise à
partir des éléments déjà traduits une
traduction.
|
Prédicteur lexical
|
|
Outil d’aide à la rédaction qui prédit des
parties de mots dès qu’il n’y a plus
d’ambiguïté, et cela même s’il
n’appartient pas au lexique, ou si le mot est erroné.
|
Recherche d’informations
|
|
Ensemble des outils linguistiques permettant de rechercher des
informations.
|
Reconnaissance automatique de la parole
|
|
Elle concerne l’identification et l’interprétation
du message vocal par une machine.
|
Reconnaissance de caractères imprimés
|
|
Procédé qui transforme l’image en mode point d’un
texte imprimé en code textuel, la rendant donc lisible par
une machine.
|
Reconnaissance de caractères manuscrits
|
|
Procédé qui transforme l’image en mode point d’un
texte manuscrit en code textuel, la rendant donc lisible par une
machine.
|
Ressource
linguistique
|
|
Ensembles
de données et de descriptions linguistiques en format
électronique, utilisées essentiellement pour
développer, améliorer et évaluer des
algorithmes ou des systèmes de traitement de la langue. On
distingue les lexiques, les dictionnaires, les grammaires, les
bases de données terminologiques.
|
SGT
|
|
Voir Systèmes de Gestion de Terminologie.
|
Synthèse de la parole
|
|
La parole est synthétisée à partir de modèles
complétés par des fragments préenregistrés
ou par concaténation d’éléments de parole
(phonèmes, mots). L’accent doit être mis sur
l’intensité, la durée et l’intonation de la parole
ainsi synthétisée afin d’obtenir un flux continu et
naturel.
|
Système d’analyse et de manipulation du signal
|
|
Système permettant d’enregistrer et d’écouter
de la parole, de calculer et de visualiser des spectrogrammes, de
filtrer le signal, d’étiqueter les données
orales, de calculer et de visualiser la prosodie.
|
Système
de Compréhension du LN
|
|
Compréhension
de requêtes exprimées en langage naturel.
|
Système de dictée vocale
|
|
Système qui décrypte une parole naturelle qui
enchaîne les phonèmes, et la retranscrit avec une
grammaire et une orthographe les plus proches possibles du message
dicté.
|
Système de réaccentuation automatique
|
|
Outil d’aide à la rédaction qui outil qui
réintroduit automatiquement les accents et autres marques
diacritiques dans un texte qui en est privé.
|
Système de résumé automatique
|
|
Outil permettant de produire automatiquement une description
concise d’un document couvrant l’intégralité
de son contenu.
|
Système de routage de documents
|
|
Système permettant le routage de documents (cf. routage de
l’information) grâce à une interconnexion de
plusieurs liaisons (réseau d’utilisateurs
expéditeurs/destinataires).
|
Système de Traduction Assistée par Ordinateur
(ou semi-automatique)
|
|
Processus consistant à aider un traducteur humain à
traduire d’une langue vers une autre au moyen d’outils logiciels.
|
Système de traduction automatique
|
|
Processus consistant à traduire automatiquement d’une
langue vers une autre à l’aide d’un ordinateur.
|
Système de Traduction semi-automatique
|
|
Voir Système de Traduction Assistée par Ordinateur.
|
Systèmes de Gestion de Terminologie
|
|
Logiciel permettant d’introduire les données
terminologiques, de les mettre à jour et d’y accéder.
Abréviation : SGT.
|
Traitement de texte avancé
|
|
Traitement de texte avec des fonctionalités telles que la
prédiction lexicale, la correction de style, etc.
|
Aide à l’édition
|
|
Outil permettant à un utilisateur de superviser un édition.
|
Aide à la rédaction
|
|
Moyens fournis parallèlement au traitement de texte en vue
d’aider l’auteur d’un texte, incluant généralement
un dictionnaire et un thesaurus en ligne, des vérificateurs
orthographiques, grammaticaux et stylistiques et des outils de
structuration, d’intégration et de interconnexion de
documents.
|
Aide à la traduction
|
|
Outil permettant à un utilisateur de superviser une
traduction.
|
Analyse de contenu
|
|
Programme ou ensemble de programmes informatiques visant la
reconnaissance du contenu d’un texte.
|
Authentification de la personne et de l’origine des
données
|
|
Preuve de l’identité d’une personne ou de
l’origine des données.
|
Cartographie des données
|
|
Moyen d’accéder au contenu d’une base de
données dont on ignore la teneur exacte en la visualisant
sous forme de graphes de concepts, parmi lesquels pourront être
choisis les termes de la requête.
|
Commandes vocales de l’édition
|
|
Gestion de l’édition par la voix.
|
Commandes vocales de l’environnement de rédaction
|
|
Gestion de l’environnement informatique par la voix.
|
Compression de données
|
|
Ensemble des moyens mis en œuvre pour réduire la
quantité de signaux nécessaire au stockage ou à
la transmission des données.
|
Confidentialité de l’information
|
|
Protection des données contre une prise de connaissance par
un tiers non autorisé.
|
Contrôle de cohérence du texte
|
|
Vérification de la cohérence de l’information d’un
texte donnée (cohérence stylistique, contextuelle,
etc.)
|
Correction grammaticale
|
|
Correction de la grammaire des mots dans un document.
|
Correction orthographique
|
|
Correction de l’orthographe des mots dans un document.
|
Correction stylistique
|
|
Correction du style d’un
texte.
|
Dictée vocale
|
|
Processus de reconnaissance automatique d’un texte et
incorporation de traitement de texte.
|
Diffusion sélective de l’information
|
|
Processus qui consiste à envoyer à intervalles
réguliers l’ensemble des références
nouvelles répondant à une requête
préalablement enregistrée.
Abréviation : DSI.
|
DSI
|
|
Voir Diffusion sélective de l’information.
|
Echange de données informatisées
|
|
Echange, entre des systèmes d’information
et par des moyens électroniques, de données
structurées suivant des normes préétablies de
messages.
Abréviation : EDI.
|
EDI
|
|
Voir Echange de données informatisées.
|
Filtrage d’informations
|
|
Processus permettant, à partir d’un large volume
d’informations dynamiques, d’extraire et de présenter
les seuls documents intéressant pour un utilisateur qui a
préalablement décrit ses centres d’intérêt
|
Gestion de documents
|
|
Processus permettant d’introduire des documents, de les mettre à
jour et d’y accéder.
|
IAO
|
|
Voir Indexation Assistée par Ordinateur.
|
Indexation Assistée par Ordinateur
|
|
Description et caractérisation du contenu de documents par
des mots oudes expressions simples, réalisée par
une personne avec l’aide de la machine.
Abréviation : IAO.
|
Indexation automatique
|
|
Description et caractérisation du contenu de documents par
des mots ou des expressions simples, sans intervention humaine.
|
Intégrité de l’information
|
|
Preuve de la non-modification de l’information.
|
LAD
|
|
Voir Lecture automatique de documents.
|
Lecture Automatique de Documents
|
|
Application qui consiste à effectuer, en utilisant des
algorithmes très évolués, la reconnaissance
de caractères (typographiés ou manuscrits) à
partir de leur image numérisée, de manière à
fournir, en sortie, les codes informatiques de caractères
reconnus nécessaires aux traitements futurs.
Abréviation : LAD.
|
Messagerie
|
|
Service géré par ordinateur fournissant aux
utilisateurs habilités les fonctions de saisie, de
distribution et de consultation différée de
messages, notamment écrits, graphiques ou sonores.
|
Numérisation
des documents
|
|
La
numérisation consiste, au moyen d’un scanner, d’une
tablette de reconnaissance de l’écriture, etc., à
transformer une représentation de l’information déjà
existante sous forme analogique (papier, microfiche, etc.) en une
représentation numérique.
|
Pertinence
|
|
En parlant d’une réponse, qui a rapport à la
question, à la requête.
|
Recherche d’information (présentation de
l’information)
|
|
Terme générique désignant généralement
l’accès à des données et l’obtention
d’informations, par un moyen quelconque, en provenance de bases de
données de langage naturel
|
Reconnaissance de formats de documents
|
|
Procédé permettant l’identification du format d’un
document (.rtf, .doc, etc.)
|
Reconnaissance optique de caractères manuscrits
|
|
Procédé qui transforme l’image en mode point d’un
texte manuscrit en code textuel, la rendant donc lisible par une
machine.
|
Reconnaissance optique de caractères typographiés
|
|
Procédé qui transforme l’image en mode point d’un
texte imprimé en code textuel, la rendant donc lisible par
une machine.
|
Résumé automatique
|
|
Extraction de l’information essentielle d’un texte
d’entrée pour construire à partir de cette
information, un nouveau texte de sortie, condensé.
|
Routage de l’information
|
|
Processus qui permet d’envoyer de l’information vers
la bonne destination
|
Serveur d’informations en ligne
|
|
Serveur sur lequel les utilisateurs peuvent visualiser, récupérer…
des documents par des moyens variés (FTP anonyme, Gopher,
WAIS, WWW, annuaires…)
|
Synthèse
|
|
Ensemble des règles qui président à la
formation de phrases à partir d’éléments
fondamentaux du langage, c’est-à-dire les morphèmes,
les mots et les parties du discours
|
TAO
|
|
Voir Traduction assistée par Ordinateur.
|
Traduction Assistée par Ordinateur
|
|
Processus de traduction qui ne peut se dérouler sans
intervention humaine.
|
Traduction automatique
|
|
Traduction de textes d’une langue maternelle à une
autre, sans intervention humaine en cours de traitement.
|
Traduction simultanée (Speech to
speech)
|
|
Système permettant à une personne de converser de
façon spontanée, par téléphone, avec
un interlocuteur ne parlant pas la même langue. Le message
de cette personne serait automatiquement traduit dans la langue de
son interlocuteur.
|
Traduction vocale
|
|
Processus permettant la traduction orale d’une communication orale
par l’intermédiaire d’un module de reconnaissance de la
parole, en passant par un module de traduction vers un module de
synthèse vocale.
|
Vérification de la personne
|
|
Il s’agit de confirmer ou d’infirmer que le locuteur
est bien celui qu’il prétend être.
|
Vérification grammaticale
|
|
Processus qui permet de vérifier la grammaire d’un
texte donné.
|
Vérification orthographique
|
|
Processus qui permet la vérification de l’orthographe
des mots.
|
Vérification stylistique
|
|
Logiciel qui examine un document pour s’assurer qu’il correspond à
une structure type du texte et du document qui le renferme ;
désigne également la vérification de l’emploi
des locutions ou des phrases d’une manière prédéfinie
|
Workflow
|
|
Système de gestion électronique de processus qui
permet d’automatiser la circulation des flux d’informations
(dans une entreprise, par exemple).
|