Corpus
|
Type
de discours
|
Domaine
|
Locuteurs
|
Contenu
|
Taille
|
ECOLE_MASSY
|
Dialogue oral
H-H simulé
|
renseignement
touristique
|
19 enfants + 1
enseignante
|
audio +
transcription
|
31 dialogues -
5300 mots - 45'
enregistrement
|
OTG
|
Dialogue oral
H-H réel
|
renseignement
touristique
|
315 touristes
+ 5 receptionnistes
|
audio +
transcription
|
315 dialogues
- 26000 mots - 2h
enregistrement
|
Accueil UBS
|
Dialogue
oral H-H réel |
accueil
téléphonique
|
40
appelants + 2 receptionnistes
|
audio +
transcription |
10
000 mots - 1h
enregistrement |
Brassens
|
Dialogue
oral H-H réel |
travail
autour du conte dans une classe de primaire
|
enfants
primaire + institutrice
|
audio +
transcription |
138
dialogues - 4h
enregistrement |
CO2 |
Dialogue
oral H-H réel (interview) |
extrait du corpus
d'Orléans : enquête sociolinguistique |
3 interviewés + 1
questionneur |
transcription
+ annotation en
coréférence et en entités
nommées |
3 interviews - 35192 mots - 3h28'
enregistrement |
ANCOR |
Parole
spontanée. Interactivité variée :
inteview ou dialogue interfactif |
variés :
enquête sociolinguistique, renseignement touristique, accueil
téléphonique |
adultes |
transcription
+ annotation en
coréférence et en entités
nommées |
488 000 mots - 30,5h - 117
000 mentions - 51 000 relations de coréférence |
TestAccord |
variés : écrit littéraire, webblogs, dialogue oral, intervieuw oral |
variés : conte pour enfant, critique de film, accueil téléphonique, enquête sociolinguistique |
7 à 27 annotateurs suivant le jeu de test |
jeux de test pour l'accord inter-annotateur (émotion, opinion, coréférence) |
sans objet |