| 
									
										| TagTools est une boîte à outils pour le TAL. Elle comporte les éléments suivants : - détecteur de format de fichier (formats reconnus : Text, MS-Office, HTML, SGML, XML, PDF, RTF) ;
 - détecteur de langue (10 langues reconnues) ;
 - aspirateur de pages Web ;
 - segmenteur de textes en phrases ;
 - segmenteur de phrases en mots (tokenization) ;
 - rattrapeur de mots mal orthographiés ;
 - analyseur morphologique traitant les mots simples et les mots composés ;
 - analyseur syntaxique robuste ;
 - extracteur de mots inconnus, pour les mots simples et/ou composés, avec des patrons d'extraction paramétrables ;
 - indexeur de documents ;
 - moteur de recherche opérant sur l'indexeur.
 |  |