Typologie : Autres  Catégorie : Outil  Langues :  Organisme :  Description :  TagTools est une boîte à outils pour le TAL. Elle comporte les éléments suivants : 
- détecteur de format de fichier (formats reconnus : Text, MS-Office, HTML, SGML, XML, PDF, RTF) ; 
- détecteur de langue (10 langues reconnues) ; 
- aspirateur de pages Web ; 
- segmenteur de textes en phrases ; 
- segmenteur de phrases en mots (tokenization) ; 
- rattrapeur de mots mal orthographiés ; 
- analyseur morphologique traitant les mots simples et les mots composés ; 
- analyseur syntaxique robuste ; 
- extracteur de mots inconnus, pour les mots simples et/ou composés, avec des patrons d'extraction paramétrables ; 
- indexeur de documents ; 
- moteur de recherche opérant sur l'indexeur. 										 | 
									 
								  |