Pôle Parole — Groupe de Travail
5.5. "Compréhension de parole"
Evaluation des systèmes de compréhension de parole
Campagne d’évaluation " par défi "
Ce document présente la campagne d’évaluation " par défi " des systèmes de compréhension de la parole (CAP) mise en oeuvre dans le cadre du GT 5.2 du PRC I3. Cette campagne vise à permettre à chacun des participants de mieux cerner les capacités et limitations de son système, et de l’améliorer éventuellement à la lumière du comportement des systèmes des autres participants. Elle ne doit donc pas être confondue avec une évaluation-compétition de type ATIS-DARPA. En particulier, trois caractéristiques principales distinguent cette campagne d’évaluation de celles classiquement menées dans le domaine :
PARTICIPANTS
Cinq systèmes de CAP ont participé à cette campagne d’évaluation :
METHODOLOGIE D'EVALUATION PAR DEFI
Jean-Yves Antoine — Version 1.2. - 22/03/2001 — Rapport de recherche VALORIA-EQUIPAGE-LN-2001-1
La méthodologie d’évaluation adoptée dans le cadre de cette campagne répond aux principes suivants :
- les résultats obtenus sont synthétisés par grandes classes d’énoncés tests. Il est donc utile que les énoncés dérivés soient construits de manière relativement systématique (pour reprendre notre exemple, définition d’un énoncé dérivé avec auto-correction pour chaque énoncé initial).
FICHIER : INIT_LAMBDACOMP.TXT
CONCEPTEUR SYSTEME : J. Villaneau (VALORIA)
ENCODAGE : signes diacritiques (accents...) ignorés
pas de majuscules
==============================================================
<1> mon train arrive le 10 decembre a 19 heures 37 </1>
<2> je voudrais reserver
une chambre sympa avec vue sur la mer </2>
FICHIER TEST : DERIVE_LAMBDACOMP_CLIPS.TXT
CONCEPTEUR TEST : M.Z. Kurdi (CLIPS)
VERSION : 2
DATE : 02/04/2001
FICHIER INITIAL : INIT_LAMBDACOMP.TXT
CONCEPTEUR SYSTEME : J. Villaneau (VALORIA)
==============================================================
<1.1> mon train le 10 decembre c'est a 19 heures 37 qu'il arrive [EXTRACTION GAUCHE + CLIVAGE] </1.1>
<1.2> a 19 heures 37 le 10 décembre il arrive mon train [EXTRACTION A GAUCHE ET A DROITE] </1.2>
....
<2.1> je voudrais reserver alors si c’est possible hein une chambre sympa avec vue sur la mer [INCISE] </2.1>
Résultats brut : Fichier équivalent au fichier de test fichier avec simple mention supplémentaire du résultat de l’analyse entre chevrons : <RES=1> pour une analyse correcte et <RES=0> sinon. Dans le cas d’une évaluation incorrecte, le champ entre chevron pourra comporter une partie informative, introduite par le mot-clé ERR précisant la nature de l’erreur observée. Par exemple : <RES=0 ERR=substitution de Tours par tour>. Cette information est placée juste avant la " balise " de fermeture d’énoncé. Exemple :
==============================================================
FICHIER RESULTAT : RESULT_LAMBDACOMP_CLIPS.TXT
FICHIER TEST : DERIVE_LAMBDACOMP_CLIPS.TXT
CONCEPTEUR TEST : M.Z. Kurdi (CLIPS)
VERSION : 2
DATE : 02/04/2001
FICHIER INITIAL : INIT_LAMBDACOMP.TXT
CONCEPTEUR SYSTEME : J. Villaneau (VALORIA)
==============================================================
<1.1> mon train le 10 decembre c'est a 19 heures 37 qu'il arrive [EXTRACTION GAUCHE + CLIVAGE] <RES=1></1.1>
<1.2> a 19 heures 37 le 10 décembre il arrive mon train [EXTRACTION A GAUCHE ET A DROITE] <RES=0 ERR=substitution 10 (décembre) par 19></1.2>
....
<2.1> je voudrais reserver alors si c’est possible hein une chambre sympa avec vue sur la mer [INCISE] <RES=1></2.1>