Top » Directory

Informations
Presentation
Inscription
Contact Us
Directory
Private company
Research Organizations
Associations
Tools
Quick Find
 
Use keywords to find the product you are looking for.
Advanced Search
TOOL_TIP_LISTE TOOL_TIP_PRINT
FASTR
FASt Term Recognition
Identification
Typologie : Indexation de documents 
Catégorie : Outil 
Langues :
Organisme : CNRS - LIMSI - Equipe Langage et Cognition 
Description :
FASTR est un outil d'analyse linguistique de la variation terminologique. Il s'appuie sur des méthodes d'informatique linguistique pour la normalisation et l'identification de termes en corpus. Il s'agit de reconnaître, en texte plein, des occurrences de termes complexes tels que mesure de flux par des méthodes d'analyse automatique de textes. Les termes n'ayant pas toujours la même forme linguistique, le principal enjeu est de pouvoir identifier leurs variantes. Dans l'état actuel FASTR identifie les trois types de variations suivants :
- les variantes syntaxiques. Mesure de volume et de flux est une variante de coordination du terme mesure de flux.
- les variantes morpho-syntaxiques. Flux de sève mesurés et mesure quotidiennement le flux sont deux variantes verbales de mesure de flux qui s'appuient sur la parenté morphologique entre le nom mesure et le verbe mesurer.
- les variantes sémantico-syntaxiques Évaluation du flux est une variante sémantico-syntaxique de mesure de flux qui fait appel à la proximité sémantique de mesure et évaluation.

La reconnaissance et la normalisation terminologiques réalisées par FASTR sont une forme d'indexation automatique, c'est-à-dire l'attribution de descripteurs à des documents textuels pour une recherche d'information en langage naturel. FASTR indexe un corpus en générant les variantes des termes d'une liste contrôlée et en les recherchant des séquences textuelles acceptables. Bien que reprenant de nombreux apports des recherches en traitement automatique du langage naturel, FASTR est une architecture nouvelle et originale dédiée à l'analyse automatique des termes.

Outre l'indexation automatique, FASTR s'applique aussi à l'enrichissement de thésaurus et à la normalisation morphologique à partir de corpus.
- L'enrichissement de thésaurus est obtenu en déconstruisant les variantes obtenues par FASTR et en extrayant de nouveaux termes appelés termes candidats. Par exemple, la variante précédente mesure de volume et de flux de mesure de flux fournit par déconstruction le terme candidat mesure de volume. En outre, puisque le candidat ainsi obtenu est lié conceptuellement au terme initial mesure de flux, l'acquisition est à la fois un apport terminologique et un apport conceptuel.
- La normalisation morphologique à partir de corpus est la recherche de relations morpho-sémantique en corpus par égalité approximative de termes multi-mots. Par exemple, à partir du terme mesure de volume, on trouve par similitude graphique, l'occurrence mesure volumétrique indiquant que les mots volumétrique et volume sont morpho-sémantiquement liés.
Informations technique
Support : FTP
Taille : 0,5 Mo (C compilé)
Type de machine : PC Pentium
Mac Quelconque
Station de travail Sun
Système : Unix Linux - Sun OS - Solaris
Windows 95/98 NT 3.5/4.0
Mémoire Minimum : 32 Mo
Mémoire recommandée : 64 Mo
Espace disque : 100 Mo (selon taille des bases
Intégration
Autonomie :
Intégration possible dans : Script shell intégrant les sorties d?un outil d?acquisition de terminologie
Disponibilité commerciale, technique et légale
Documentation en ligne :
Documentation en français :
Utilisateurs potentiels : Intégrateur, Recherche,
Contact
M. Christian Jacquemin
Email : jacqueminlimsi.fr
Fax : 01 69 85 80 88
Téléphone : 01 69 85 80 22
Created date : 2005-02-25 12:57:50