Typologie : Classement ou classification de documents Catégorie : Produit/Logiciel Langues : Organisme : ERIC Description : Le logiciel SIPINA est un outil généraliste de classification automatique, possédant un module spécifiquement dédié à la classification automatique de textes. Ce module permet de coder un ensemble de textes ( au format texte standard pour PC) sous la forme classique d'un tableau où chaque texte est représenté par un vecteur de descripteurs du type « attribut = valeur ». Les attributs, numériques, peuvent désigner un nombre d'occurrences ou une fréquence pour un N-gram (séquence de n signes) un mot, une racine ....
Cet outil fournit certaines statistiques sommaires sur les attributs retenus, et peut exporter le tableau de description obtenu vers un tableur comme Excel pour des traitements spécifiques.
Différents algorithmes sont disponibles pour classer les textes lorsque le codage a été effectué : graphes d'induction (méthodes Sipina, Id3 ...), Réseaux de neurones, Analyse discriminantes... |
|