Portail des technologies de la langue

00000001.jpg

CHERCHER

Accueil

Contact

Technologies de la Langue

Introduction au domaine

Enjeux & Limites

Chiffres cl�s

Études de cas & Visites d’entreprises

Panorama

Les acteurs du domaine

Formations et m�tiers

Th�ses

Ressources et outils

Initiatives nationales & europ�ennes

Action Technolangue

Pr�sentation

Th�mes

Projets

Plate-forme EVALDA

EVALDA - ARCADE II

EVALDA - CESART

EVALDA - CESTA

EVALDA - ESTER

EVALDA - EQUER

EVALDA - MEDIA

EVALDA - EVASY

EVALDA - EASY

AGILE - ALIZÉ

AGILE - OURAL

AGILE - TILT

AGILE - WATSON

ATONANT

CARMEL

EurADiC

NEOLOGOS

NomsPropres

NORMALANGUE - RNIL

NORMALANGUE - Technovox

Technolangue.Net

Normes & Standard

Enjeux

Instances

Imprimer cet article

NEOLOGOS

mardi 18 novembre 2003

Cr�ation de nouvelles bases de donn�es vocales t�l�phoniques pour la langue fran�aise : base multilocuteurs pour voix d'enfants et d'adolescents et base de locuteurs de r�f�rence pour voix d'adultes.

Fiche du 18 novembre 2003

Th�me de l'action

Ressources linguistiques

D�but du projet

4 d�cembre 2002

Dur�e du projet

24 mois

R�sum�

Dans le but de r�pondre � un besoin ressenti dans le milieu du traitement automatique de la langue, le projet NEOLOGOS se propose de constituer deux bases de donn�es de parole identifi�es sous les noms PAIDIALOGOS et IDIOLOGOS.
La premi�re, PAIDIALOGOS, sera le r�sultat d'une collecte compos�e d'appels t�l�phoniques de 1000 enfants et adolescents �g�s de 7 � 17 ans, 350 en GSM et 650 en RTC.
La seconde, IDIOLOGOS, est constitu�e de deux parties, la premi�re partie se compose des enregistrements d'appels t�l�phoniques de 1000 adultes ayant effectu� un appel chacun. La deuxi�me partie de la base est compos�e d'un �chantillon de 200 personnes du panel de la premi�re partie ayant effectu� 10 appels t�l�phoniques suppl�mentaires dans le but de cr�er une base de locuteurs de r�f�rence.

Objectifs

PAIDIALOGOS : base de donn�es de voix d'enfants et d'adolescents.

Le r�sultat de cette partie du projet consiste en une base de donn�es vocales de 1000 voix d'enfants, autant de gar�ons que de filles, �quir�partis g�ographiquement (en France m�tropolitaine), collect�e sur le r�seau RTC (650 locuteurs) et sur le r�seau GSM (350 locuteurs), et pour la tranche d'�ge allant de 7 ans � 17 ans. Le contenu linguistique enregistr� est un ensemble de phrases courtes phon�tiquement �quilibr�es.

IDIOLOGOS : Base de locuteurs de r�f�rence pour voix d'adultes.

Le r�sultat de cette partie du projet consiste en une base de donn�es vocales appel�e � locuteurs de r�f�rence � (200 locuteurs) issue d'un panel initial de 1000 locuteurs, hommes et femmes �galement repr�sent�s, �quir�partis g�ographiquement (en France m�tropolitaine), collect�e sur le r�seau RTC. Le contenu linguistique enregistr� est un ensemble compos� d'�nonc�s lu ou spontan� de mot de commande, de nombres, dates, num�ros et de phrases phon�tiquement �quilibr�es pour la premi�re partie et uniquement un ensemble de phrases phon�tiquement �quilibr�es pour la seconde partie.

Mise en œuvre et état de l'art

De nombreuses bases de donn�es sont disponibles � ELDA, mais aucune ne propose une couverture suffisante de la population des jeunes.

Aucune ne poss�de non plus la dimension et la structure n�cessaire pour r�pondre au besoin de disposer de � locuteurs de r�f�rence �, car aucune ne contient suffisamment d'informations pour r�aliser une cartographie coh�rente de l'espace des locuteurs. Il existe des bases de donn�es orient�es vers le test de syst�mes de v�rification du locuteur, mais les bases accessibles publiquement sont insuffisamment structur�es, et par ailleurs, elles privil�gient une m�thodologie de collecte permettant de capter voire d'amplifier les variations au cours du temps, lentes ou rapides, de la voix d'un locuteur (variation intra-locuteurs).

Concernant l'approche nouvelle de la base des � locuteurs de r�f�rence �, les laboratoires et les industriels ont le m�me besoin fondamental d'acc�der � des bases de donn�es permettant d'une part de rendre la technologie plus performante, d'autre part d'exp�rimenter de nouvelles approches algorithmiques bas�es sur une connaissance plus fine de ce qui caract�rise individuellement les locuteurs.

Pour la r�alisation des diff�rentes collectes de donn�es vocales pr�vues par le projet, les industriels membres du consortium disposent des m�thodologies et des plates-formes vocales de collecte t�l�phonique ad�quates.

Retomb�es du projet

Le consortium du projet NEOLOGOS s'est donn� comme objectif de r�pondre � deux besoins qui ne sont pas couverts actuellement par les bases de donn�es disponibles pour la langue fran�aise.

La base de donn�es de � locuteurs de r�f�rence � IDIOLOGOS ne suit pas une structure classique de type Speechdat, et elle est massive car elle contient 8000 appels t�l�phoniques soit quatre fois plus de donn�es que la base PAIDIALOGOS. Cette base permettra de faire avancer de fa�on significative les performances des technologies de reconnaissance vocale ainsi que les connaissances scientifiques sur les caract�ristiques des locuteurs, car elle contiendra un nombre suffisant de locuteurs pour repr�senter l'ensemble des voix possibles, et pour chacun des locuteurs, un nombre d'enregistrement suffisant pour permettre de fabriquer des mod�les de reconnaissance phon�tiques individualis�s et pr�cis, adapt�s � sa voix. La base IDIOLOGOS constituera en quelque sorte la mat�rialisation du concept d'espace de locuteurs. Au-del� des besoins importants de la reconnaissance vocale, cette base de donn�es sera �galement exploit�e dans les autres domaines des technologies vocales pour lesquels la notion de caract�ristiques du locuteur joue un r�le significatif : v�rification du locuteur, identification du locuteur, transformation de voix, synth�se vocale.

Etat d'avancement

Le projet a d�marr� effectivement le 11 f�vrier 2003 (r�union de pr�lancement), soit plus de deux mois apr�s la date de notification officielle du 4 d�cembre 2002. La coordination du projet a �t� assur�e � travers plusieurs r�unions physiques et de nombreuses r�unions t�l�phoniques.

La base PAIDIALOGOS, base de donn�es � enfants � similaires aux bases de donn�es traditionnelles de voix � adultes �, est compos�e d'enregistrements d'appels t�l�phoniques dont les sp�cifications ont �t� adapt�es du mod�le SpeechDat, largement utilis� � l'international. Le contenu linguistique des appels est compos� d'un ensemble de trente-deux �nonc�s diff�rents comprenant des mots de commande, des s�quences de chiffres et de nombres, des dates et des heures, des �pellations, des noms de villes et de personnes, des mots et phrases phon�tiquement riches. A la diff�rence de SpeechDat, les trois modes possibles de collecte des enregistrements seront utilis�s : collecte de parole r�p�t�e, de parole lue et de parole spontan�e.

La collecte des 1000 enfants est en cours. Environ 50 % de la base a �t� collect�e.

L'objectif du sous-projet IDIOLOGOS est de constituer une base de 200 locuteurs de r�f�rences, comprenant pour chaque locuteur une quantit� de donn�es suffisante pour permettre de construire des mod�les acoustiques pr�cis propres � sa voix. Pour identifier les 200 locuteurs de r�f�rences, on part d'un premier ensemble de 1000 locuteurs de d�part, construit selon l'approche classique des bases SpeechDat bas�e sur un �quilibre classique homme/femme, �ge et accent r�gional.

Les sp�cifications de la base ont n�cessit� de mener de fa�on conjointe la sp�cification du corpus texte et de celui des crit�res permettant de s�lectionner les locuteurs de r�f�rences � partir des locuteurs de d�part. Les crit�res sont d�sormais bien identifi�s et le corpus texte � �t� compl�tement sp�cifi� : les locuteurs de d�part prononcent chacun un corpus identique de 50 phrases, en un seul appel t�l�phonique, et les locuteurs de r�f�rences prononcent tous un corpus identique de 500 phrases, en dix appels. Les deux corpus ont �t� calcul�s � partir de corpus de textes bruts tr�s importants de fa�on � maximiser la couverture en terme de phon�mes et de classes de diphones.

Les enregistrements de la base d'amor�age de 1000 locuteurs sont termin�es depuis avril 2004. Les s�lections des 200 locuteurs pour la seconde phase ont �t� faites durant l'�t� 2004. Les enregistrements des 200 locuteurs de r�f�rence sont en cours.

En conclusion, les phases de sp�cification des corpus et des m�thodes sont termin�es pour les corpus IDIOLOGOS et PAIDIALOGOS. La base IDIOLOGOS phase 1 comprenant 1000 locuteurs a �t� collect�e entre janvier et avril 2004. Celle-ci a permis la s�lection de 200 locuteurs de r�f�rence. La collecte de la base enfant PAIDIALOGOS est en cours ainsi que celle de la base adultes IDIOLOGOS phase 2 des 200 locuteurs de r�f�rence.

R�sultats

LES RESSOURCES PRODUITES DANS NEOLOGOS SONT DESORMAIS DISPONIBLES AUPRES D’ELRA :

Les ressources linguistiques du projet NEOLOGOS sont d�sormais disponibles dans le catalogue de ressources linguistiques d'ELRA. Elles se composent des bases de donn�es suivantes :

ELRA-S0226-01 IDIOLOGOS 1 "Bootstrap" (NEOLOGOS Project)
Cette base de donn�es contient les enregistrements de 1 000 locuteurs fran�ais adultes (470 hommes, 530 femmes) enregistr�s � travers le r�seau t�l�phonique fixe fran�ais. Les locuteurs ont prononc� 45 phrases phon�tiquement riches. Ces 45 phrases sont identiques pour tous les locuteurs.

ELRA-S0226-02 IDIOLOGOS 2 "Eingenspeakers" (NEOLOGOS Project)
Cette base de donn�es contient les enregistrements de 200 locuteurs fran�ais adultes (97 hommes, 103 femmes) enregistr�s � travers le r�seau t�l�phonique fixe fran�ais. Les locuteurs ont prononc� 45 phrases phon�tiquement riches, avec 10 appels par locuteur. Les 450 phrases prononc�es par locuteur sont identiques pour tous les locuteurs. Les locuteurs ont �t� s�lectionn�s � partir de la base IDIOLOGOS 1 "Bootstrap" (ELRA-S0226-01).

ELRA-S0227 PAIDIALOGOS (NEOLOGOS Project)
Cette base de donn�es contient 37 364 occurrences de 1 010 locuteurs fran�ais enfants (510 hommes, 500 femmes) enregistr�s � travers le r�seau t�l�phonique fixe fran�ais.

Partenaires du projet

ELDA
ENSSAT
France T�l�com R&D
IRISA
LORIA
TELISMA

Contacts

Djamel Mostefa
email : mostefa@elda.org
Olivier Boeffard
email : Olivier.Boeffard@enssat.fr
Delphine Charlet
email : delphine.charlet@rd.francetelecom.com
Fr�d�ric Bimbot
email : frederic.bimbot@irisa.fr
Odile Mella
email : mella@loria.fr
Arnaud Vall�e
email : avallee@telisma.com