Dictionnaire Intégral - Dicolo
Dictionnaire Intégral TM
Identification
Typologie :
Catégorie : Ressource 
Langues :
Organisme : Mémodata Sarl 
Description :
Le DICTIONNAIRE INTEGRAL est un objet un peu long à définir. Il a été connu du grand public sous le nom de Dicologique, avec pour dernière édition 1992. Depuis il a fortement évolué. Aujourd'hui, le DICTIONNAIRE INTEGRAL est la base linguistique et conceptuelle sur laquelle s'appuie la plupart des outils de la société MEMODATA. En particulier, le SEMIOGRAPHE réalise à partir du dictionnaire intégral une représentation topologique et vectorielle qui permet à un ordinateur de réaliser plusieurs opérations de désambiguïsation sémantique, parmi lesquelles la gestion des génériques (entre autre pour les anaphores lexicales) et l'identification sémantique des polysèmes par les contextes des énoncés.
Voici d'une façon simplifiée son modèle de données :
L'unité linguistique de base du DICTIONNAIRE INTEGRAL est le mot-sens.
Un mot-sens possède une catégorie flexionnelle (Dico-morph), une catégorie syntaxique (Dico-synt), 0 à N niveaux de langue, 0 à N contraintes d'apparition, 0 à N identifications d'applications, 1 langue, 1 site de gestion, 0 à n liens linguistiques pour environ 50 fonctions lexicales (synonymie, dérivation, permutation...), 0 à N liens conceptuels (ou d'idéation) typés vers les concepts du dictionnaire. Il y a aujourd'hui 180.000 mots-sens dans le DICTIONNAIRE INTEGRAL' pour le français. Chaque mot-sens entretient en moyenne 1,7 relations avec la couche conceptuelle.
L'unité conceptuelle de base du DICTIONNAIRE INTEGRAL' est le concept. Un concept est doté d'un type, d'une ou plusieurs formulations langagières quand on travaille en multilingue, d'un site de gestion, de 0 à N liens typés vers les concepts du dictionnaire. Chaque concept entretient en moyenne 1,5 relations avec la couche conceptuelle. Il y a environ 40.000 concepts.
Il existe enfin une catégorie spécifique de mots qui portent d'autres mots. Ces mots ont ainsi un statut hybride, entre le mot et le concept. Ils sont désignés comme les "petits carrés" car c'est ainsi qu'ils apparaissent à l'écran. Il s'agit souvent de noms propres structurés par des relations spécifiques (appartenance géographique...) et structurant d'autres mots (parisien pour Paris, par exemple, mais aussi "Lannion" par rapport à "Côte d'Armor").
Au total le Dictionnaire Intégral comporte plus de 360.000 relations qui forment un graphe orienté d'une profondeur moyenne de 11 noeuds. On évalue aujourd'hui à plus de 4 milliards le nombre de connaissances implicites contenues dans le graphe, et constituées de l'association structurelle des concepts.
Enfin, le Dictionnaire Intégral comporte environ 40.000 mots-sens par langue pour quatre autres langues : espagnol, italien, français, allemand.
Informations technique
Support : CD-Rom
Taille : 300 Mo
Type de machine : PC
Système : Windows
Intégration
Autonomie :
Intégration dans les applications : Le Sémiographe
Intégration possible dans : Plusieurs applications
Disponibilité commerciale, technique et légale
Disponibilité :
Contraintes :
Commercialisation : Mémodata & ELDA (pour des morceaux extraits)
Documentation en ligne :
Documentation en braille :
Documentation en français :
Utilisateurs potentiels : Utilisateur final, Intégrateur,