Portail Technolangue.net

Top » Directory

Informations

Presentation
Inscription
Contact Us

Directory

Private company
Research Organizations
Associations
Tools

Quick Find

<<< TEXT_PAGE_PREC

TEXT_PAGE_NEXT >>>

FASTR
FASt Term Recognition

Identification

Typologie : Indexation de documents
Catégorie : Outil
Langues :
Organisme : CNRS - LIMSI - Equipe Langage et Cognition

Description :

FASTR est un outil d'analyse linguistique de la variation terminologique. Il s'appuie sur des méthodes d'informatique linguistique pour la normalisation et l'identification de termes en corpus. Il s'agit de reconnaître, en texte plein, des occurrences de termes complexes tels que mesure de flux par des méthodes d'analyse automatique de textes. Les termes n'ayant pas toujours la même forme linguistique, le principal enjeu est de pouvoir identifier leurs variantes. Dans l'état actuel FASTR identifie les trois types de variations suivants :
- les variantes syntaxiques. Mesure de volume et de flux est une variante de coordination du terme mesure de flux.
- les variantes morpho-syntaxiques. Flux de sève mesurés et mesure quotidiennement le flux sont deux variantes verbales de mesure de flux qui s'appuient sur la parenté morphologique entre le nom mesure et le verbe mesurer.
- les variantes sémantico-syntaxiques Évaluation du flux est une variante sémantico-syntaxique de mesure de flux qui fait appel à la proximité sémantique de mesure et évaluation.

La reconnaissance et la normalisation terminologiques réalisées par FASTR sont une forme d'indexation automatique, c'est-à-dire l'attribution de descripteurs à des documents textuels pour une recherche d'information en langage naturel. FASTR indexe un corpus en générant les variantes des termes d'une liste contrôlée et en les recherchant des séquences textuelles acceptables. Bien que reprenant de nombreux apports des recherches en traitement automatique du langage naturel, FASTR est une architecture nouvelle et originale dédiée à l'analyse automatique des termes.

Outre l'indexation automatique, FASTR s'applique aussi à l'enrichissement de thésaurus et à la normalisation morphologique à partir de corpus.
- L'enrichissement de thésaurus est obtenu en déconstruisant les variantes obtenues par FASTR et en extrayant de nouveaux termes appelés termes candidats. Par exemple, la variante précédente mesure de volume et de flux de mesure de flux fournit par déconstruction le terme candidat mesure de volume. En outre, puisque le candidat ainsi obtenu est lié conceptuellement au terme initial mesure de flux, l'acquisition est à la fois un apport terminologique et un apport conceptuel.
- La normalisation morphologique à partir de corpus est la recherche de relations morpho-sémantique en corpus par égalité approximative de termes multi-mots. Par exemple, à partir du terme mesure de volume, on trouve par similitude graphique, l'occurrence mesure volumétrique indiquant que les mots volumétrique et volume sont morpho-sémantiquement liés.

Informations technique

Support :	FTP
Taille :	0,5 Mo (C compilé)
Type de machine :	PC Pentium Mac Quelconque Station de travail Sun
Système :	Unix Linux - Sun OS - Solaris Windows 95/98 NT 3.5/4.0
Mémoire Minimum :	32 Mo
Mémoire recommandée :	64 Mo
Espace disque :	100 Mo (selon taille des bases

Intégration

Autonomie :

Intégration possible dans : Script shell intégrant les sorties d?un outil d?acquisition de terminologie

Disponibilité commerciale, technique et légale

Documentation en ligne :

Documentation en français :

Utilisateurs potentiels : Intégrateur, Recherche,

Contact

M. Christian Jacquemin
Email : jacqueminlimsi.fr Fax : 01 69 85 80 88 Téléphone : 01 69 85 80 22

Created date : 2005-02-25 12:57:50

Le Portail
Technolangue.Net