Xerox IFSP
Xerox Incremental Finite State Parser
Identification
Typologie : Analyse syntaxique 
Catégorie : Outil 
Langues : anglais  espagnol, castillan  
Organisme : Xerox - XRCE 
Description :
L'outil IFSP ( Incremental Finite-State Parser) est un analyseur syntaxique partiel (shallow parser) qui construit les groupes syntagmatiques noyau dans les phrases en entrée, puis utilise la structure ainsi construite pour extraire des relations syntaxiques entre les mots (sujet, sujet passif, objet direct, etc.). Les phrases sont préalablement segmentée et étiquetées avec un étiqueteur morpho-syntaxique, afin de réduire les éventuelles ambiguïtés d'analyse. A chaque mot de la phrase est alors associée une et une seule étiquette morpho-syntaxique indiquant la catégorie du mot et éventuellement quelques traits morphologiques comme le nombre, la personne, le mode de conjugaison. Aucune autre information lexicale d'ordre syntaxique (transitivité, sous-catégorisation, etc.) n'est utilisée.
Sur les phrases ainsi étiquetées s'opèrent ensuite des transformations successives pour l'annotation des groupes noyaux (chunks) dont les modèles sont décrits sur les suites d'étiquettes morpho-syntaxiques.
Une fois les groupes noyaux délimités, l'analyseur assigne à la phrase des étiquettes de fonction syntaxique principale (sujet, objet, etc.) et, en fonction des règles d'extraction spécifiées sur la structure des groupes noyaux, extrait des relations de dépendances syntaxiques explicites entre les mots. Au total 26 types de dépendances sont extraites parmi lesquels SUBJ (sujet), SUBJPASS (sujet passif)...
La reconnaissance des groupes noyaux et l'extraction des relations syntaxiques entre les mots se fait grâce à des règles de description écrites sous forme d'expressions régulières du calcul à états finis de Xerox, qui sont compilées ensuite en une cascade de transducteurs. Ces transducteurs sont appliqués sur les phrases étiquetées avec un algorithme général utilisé également pour l'analyse morphologique.
Informations technique
Support : CD-Rom
FTP
Type de machine : PC
Station de travail Sun
Système : Unix Solaris 2.5.
Windows NT 3.5/4.0
Mémoire Minimum : 64 Mo
Mémoire recommandée :
Espace disque : 20 Mo
Intégration
Autonomie :
Disponibilité commerciale, technique et légale
Disponibilité :
Contraintes :
Documentation en ligne :
Documentation en braille :
Documentation en français :
Utilisateurs potentiels :