Retour au format normal

Master en Traitement Automatique des Langues à Nancy

11 mai 2005

Technolangue.net

 

Le Traitement Automatique des Langues : un domaine en plein essor


Le TAL est un domaine à la fois scientifique et technologique qui se caractérise par l’utilisation de l’ordinateur pour traiter automatiquement le langage humain. Du traitement de la parole à celui du sens en passant par celui du texte écrit, il débouche sur les applications les plus diverses : correction orthographique, indexation automatique, extraction de connaissances, interrogation de bases de données en langage naturel, aide à la traduction, web sémantique ...Et l’explosion d’Internet où le langage humain reste un vecteur d’information prépondérant en fait un domaine en plein essor.


Nancy : un pôle de premier plan dans la recherche en TAL en France


Ces dernière années, le TAL a pris une place de plus en plus grande dans la recherche à Nancy et il occupe aujourd’hui près de 40 chercheurs et enseignants-chercheurs au LORIA et à l’ATILF qui sont respectivement les laboratoires d’informatique et de linguistique de Nancy. Ce sont des chercheurs et enseignants-chercheurs de ces deux laboratoires ayant une compétence reconnue nationalement et internationalement qui enseigneront dans le master. La spécialité TAL-R pourra se prolonger par la préparation d’un doctorat dans l’un des deux laboratoires d’accueil.


Une insertion dans un cadre européen


La spécialité TAL-R s’inscrit dans le cadre international du programme Erasmus Mundus et sera reliée à huit masters en TAL d’autres pays européens, permettant ainsi aux étudiants d’effectuer des séjours à l’étranger et de bénéficier de cours donnés par des chercheurs de réputation internationale venant d’autres pays.


Les pré-requis pour suivre la formation


Les spécialités TAL-R IL-P s’adressent aux étudiants qui ont des connaissances de base en informatique et qui souhaitent se tourner vers l’application de l’informatique au traitement des langues. Elle s’adresse également aux étudiants en linguistique ainsi qu’aux étudiants qui ont une formation pluridisciplinaire centrée autour des sciences cognitives et qui souhaitent se spécialiser dans le domaine du TAL.

La spécialité TAL-R est commune au master Informatique (Info) et au master Sciences de la Cognition et Applications (SCA) des 3 universités nancéiennes. La spécialité IL-P est, en revanche, ancrée dans le master Sciences de la Cognition et Applications (SCA) de l’Université Nancy 2. Les étudiants titulaires d’une licence ou d’une équivalence peuvent s’inscrire dans la spécialité TAL-R ou IL-P du Master SCA ou dans la spécialité TAL-R du Master Informatique. L’inscription en seconde année s’effectue sur dossier pour les étudiants titulaires d’une première année de master ou d’une équivalence.


Le contenu de la formation


Il vise à donner de solides compétences en TAL en s’appuyant sur la pluridisciplinarité ; il fait appel aux différents domaines concernés par le TAL : l’informatique, la linguistique, la logique et les sciences cognitives.

La spécialité TAL-R

En première année, les étudiants inscrits en TAL-Info auront une formation générale en informatique et les étudiants inscrits en TAL-SCA auront une formation pluridisciplinaire en informatique, linguistique et sciences cognitives mais tous auront une initiation au TAL qui est commune aux deux masters (cours sous la responsabilité de Patrick Blackburn).

En deuxième année, la formation est entièrement commune aux deux masters. Elle est constituée tout d’abord de 3 unités d’enseignement fondamentales obligatoires de 30h chacune :

-  logique et statistiques pour la modélisation des langues (Carlos Areces et Kamel Smaïli),
-  outils et algorithmes pour le TAL (Bertrand Gaiffe et Guy Perrier),
-  applications du TAL (Claire Gardent).

Ensuite, les étudiants auront à choisir 4 unités d’enseignement de 15h chacune parmi la liste suivante :


-  formalismes grammaticaux (Azim Roussanaly) ;
-  sémantique computationnelle (Philippe de Groote) ;
-  représentation et traitement du discours (Patrick Blackburn) ;
-  méthodes à base de corpus (Susanne Alt-Almon) ;
-  génération (Claire Gardent) ;
-  parole (Anne Bonneau) ;
-  fouille de données (Yannick Toussaint) ;
-  ressources linguistiques et normalisation (Laurent Romary) ;
-  lexicologie (Jean-Marie Pierrel). Toutes ces unités ne seront pas ouvertes tous les ans. En moyenne, une unité sera ouverte un an sur deux, plus si l’unité est très demandée.

La deuxième année s’achèvera par un stage de recherche de 5 mois qui pourra être effectuée au LORIA ou à l’ATILF.

La spécialité IL-P

La spécialité IL-P permet d’acquérir une compétence double en informatique et en traitement informatique des textes qui répondra aux problèmes industriels de l’exploitation de l’information, cumulant :


Les étudiants ayant suivi cette formation auront un profil d’ingénieur-linguiste ou informaticien linguiste(fonction de chef de projet en ingénierie linguistique) notamment, en ce qui concerne l’édition électronique, la veille technologique (analyse de contenu) et la conception de systèmes d’information.

En première année, la formation se compose des unités d’enseignement suivants :

-  Fondements mathématiques
-  Algorithmique avancée
-  Codage et normalisation de données
-  Systèmes distribués pour le TAL
-  PERL pour le TAL et le web
-  Représentation de connaissances
-  Initiation au TAL
-  Linguistique
-  Terminologie et indexation
-  Bases de données lexicales
-  Projet tutoré

En seconde année, les unités d’enseignement sont les suivantes :

-  Web sémantique
-  Syntaxe partielle et robuste
-  Application distribuées
-  Lexique et sémantique lexicale
-  Anglais
-  Gestion des ressources linguistiques
-  Etude de cas
-  Stage entre 3 et 5 mois


Comment en savoir plus et s’inscrire


Pour en savoir plus, vous pouvez consulter le site web ou prendre contact avec le responsable de la formation Guy Perrier.

Pour vous inscrire, vous pouvez contacter :