GDR I3 - " Intelligence — Information — Interaction "

Pôle Parole — Groupe de Travail 5.5. "Compréhension de parole"

logo GDR-I3  

Evaluation des systèmes de compréhension de parole

Campagne d’évaluation " par défi "


EVALUATION " PAR DEFI "

Ce document présente la campagne d’évaluation " par défi " des systèmes de compréhension de la parole (CAP) mise en oeuvre dans le cadre du GT 5.2 du PRC I3. Cette campagne vise à permettre à chacun des participants de mieux cerner les capacités et limitations de son système, et de l’améliorer éventuellement à la lumière du comportement des systèmes des autres participants. Elle ne doit donc pas être confondue avec une évaluation-compétition de type ATIS-DARPA. En particulier, trois caractéristiques principales distinguent cette campagne d’évaluation de celles classiquement menées dans le domaine :

Ces objectifs sont atteints par l’intermédiaire d’une méthodologie d’évaluation " par défi ", présentée ci-dessous.

PARTICIPANTS

Cinq systèmes de CAP ont participé à cette campagne d’évaluation :

RESULTATS PUBLICATIONS

METHODOLOGIE D'EVALUATION PAR DEFI
 

Jean-Yves Antoine — Version 1.2. - 22/03/2001 — Rapport de recherche VALORIA-EQUIPAGE-LN-2001-1


La méthodologie d’évaluation adoptée dans le cadre de cette campagne répond aux principes suivants :

- chaque système est évalué par son concepteur : à lui de juger si la représentation sémantique élaborée sur un énoncé test donné est correcte ou non,

- les résultats obtenus sont synthétisés par grandes classes d’énoncés tests. Il est donc utile que les énoncés dérivés soient construits de manière relativement systématique (pour reprendre notre exemple, définition d’un énoncé dérivé avec auto-correction pour chaque énoncé initial).

Une réunion de travail de l’ensemble des participants permettra enfin une comparaison qualitative de ces différents résultats. Celle-ci donnera lieu, si les participants le jugent utile, à publication.
 
Format des fichiers— Afin de respecter notre objectif d’évaluation " légère ", les fichiers de test seront au format ASCII et répondront au format le plus simple possible, à savoir : ==============================================================

FICHIER : INIT_LAMBDACOMP.TXT

CONCEPTEUR SYSTEME : J. Villaneau (VALORIA)

ENCODAGE : signes diacritiques (accents...) ignorés

pas de majuscules

==============================================================

<1> mon train arrive le 10 decembre a 19 heures 37 </1>

<2> je voudrais reserver une chambre sympa avec vue sur la mer </2>