Corpus
Accueil UBS
Description
Description
-
Description
détaillée
Nom et
version
du corpus |
Accueil
UBS — Version 1.1 (transcription non
révisée complètement - 1er septembre
2013) |
Fournisseur |
Laboratoire
LI
(EA 6300, Université François Rabelais de Tours) |
Concepteurs |
J.
Foulon, J.-Y.
Antoine |
Type de
corpus |
Dialogue
oral H-H réel
(accueil téléphonique du standard d'une
université)
Locuteurs : 40 appelants + 2 réceptionnistes |
Contenu
du
corpus |
40
dialogues — 10000 mots — 1 heures d'enregistrement
Fichiers sons + transcription orthographique (format XML, ASCII, DOC,
ODT, PDF) |
Enregistrements |
J.
Foulon (VALORIA, U. Bretagne Sud) |
Transcription |
J.
Foulon (VALORIA, U. Bretagne Sud) |
Révision |
J.
Muzerelle (LLL, U. Orléans), J.-Y.
Antoine (LI, U. Tours) |
Licence de Distribution |
Creative
Commons CC-BY-SA
|
Financement |
Projet
AGILE-OURAL (action
TECHNOLANGUE du MESR), projet ANCOR (Région Centre) |
Distribution
du corpus
Ce
corpus est diffusé également via le
Speech and Language Data
Repository / Ortolgand : [
SLDR000890]
Sous réserve
de respect des convention d'utilisation
présentées ci-parès, le corpus est
distribué suivant deux modes:
Transcriptions
seules —
Téléchargement gratuit des fichiers de
transcription aux différents formats XML, ASCII, MS-Word,
Open Office ou PDF :
- archive ZIP comportant
l'intégralité du corpus
Corpus audio + transcriptions —
Compte tenu de la taille des fichiers audio, le corpus est
distribué sur CD adressé par courrier postal. Il
vous est demandé une participation de 15 Euros correspond
aux frais de constitution et d’envoi du CD. Retournez pour
cela le formulaire ainsi que votre
règlement à : Jean-Yves Antoine, IUP
Blois, Antenne Universitaire de Blois, 3 place Jean Jaurès,
41000 BLOIS, France.
Convention
d'utilisation
Hormis
les frais d'expédition de CD dans le cadre du corpus avec
fichiers audio, le
corpus Accueil UBS est distribué gratuitement sous licence
Creative
Commons CC-BY-SA.
Cela signifie que vous devez respecter le contrat
d’utilisation suivant :
- BY :
paternité
-
Vous devez citer les auteurs de ce corpus pour toute utilisation du
corpus.
Dans le cas d’une publication s’appuyant sur ces
travaux,
nous vous demandons
ainsi de citer les articles référencés
dans la
description de la ressource jointe à la distribution ou dans
la
liste ci-dessous.
- SA :
partage des
conditions initiales à l’identique -
Vous ne pouvez créer une nouvelle ressource à
partir de la ressource existante
et en faire ensuite un usage différent de celui
imposé par ce contrat. Là
encore, nous sommes ouverts à toute utilisation du corpus
pour création de
nouvelles ressources, mais nous vous demandons de nous contacter pour
discuter
de ces nouveaux usages.
Important - Par
ailleurs, malgré tout le soin porté à
l'anonymation des locuteurs, cette
ressource peut intégrer des échanges dont la
communication porte atteinte à
la protection de la vie privée ou portant
appréciation ou jugement de
valeur sur une personne physique nommément
désignée, ou facilement
identifiable, ou qui font apparaître le comportement d'une
personne
dans des conditions susceptibles de lui porter préjudice.
(Code du
Patrimoine, art. L. 213-2, I, 3) . A ce titre, ce corpus peut
être
utilisé à des fins d'analyse,
mais en
aucun cas ne peut être destiné à
d'autres usages donnant lieu par exemple à diffusion
publique....
Publications
liées à la ressource
- Pascale NICOLAS, Sabine
LETELLIER-ZARSHENAS, Igor SCHADLE, Jean-Yves ANTOINE, Jean
CAELEN
(2002). Towards a large corpus of spoken dialogue in French that will
be freely available: the “Parole Publique” project
and its
first realisations. Actes LREC’2002. 3rd european conference
on
language resources and evaluation. Las Palmas de Gran Canaria, Espagne.
Mai 2002
- Jean-Yves
ANTOINE, Jerome GOULIAN, Jeanne
VILLANEAU, Marc LE TALLEC (2009)
Word Order Phenomena in Spoken French : a Study on Four Corpora of
Task-Oriented Dialogue and its Consequences on Language Processing.
Proc. Corpus
Linguistics’2009, Liverpool, UK, July
2009 [HAL-00483777].
Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Partage dans les Mêmes Conditions 3.0 France.