Corpus
OTG
Description
Description
-
Description
détaillée
Nom et
version
du corpus |
OTG
— Version 1.0 (3 juin 2002) |
Fournisseur |
Laboratoire
VALORIA |
Concepteurs |
P.
Nicolas, M. Bessac, I. Schadle, J.-Y.
Antoine |
Type de
corpus |
Dialogue
oral H-H réel
(renseignement à l'Office du Tourisme de Grenoble)
Locuteurs : 315 touristes + 5 réceptionnistes |
Contenu
du
corpus |
315
dialogues — 26000 mots —
2 heures d'enregistrement
Fichiers sons + transcription orthographique (format XML, ASCII, DOC,
ODT, PDF) |
Enregistrements |
M.
Bessac (LIG - GETALP) |
Transcription |
P.
Nicolas et J. Foulon (VALORIA) |
Licence de Distribution |
Creative
Commons CC-BY-SA
 |
Financement |
AUF
(ARC-ILOR B2 "Dialogue Oral") et projet AGILE-OURAL (action
TECHNOLANGUE) |
Distribution
du corpus
Ce
corpus est diffusé également via le
Speech and Language Data
Repository : [
SLDR000831]
Sous réserve
de respect des convention d'utilisation
présentées ci-parès, le corpus est
distribué suivant deux modes:
Transcriptions
seules —
Téléchargement gratuit des fichiers de
transcription aux différents formats XML, ASCII, MS-Word,
Open Office ou PDF :
- archive ZIP comportant
l'intégralité du corpus

Corpus audio + transcriptions —
Compte tenu de la taille des fichiers audio, le corpus est
distribué sur CD adressé par courrier postal. Il
vous est demandé une participation de 15 Euros correspond
aux frais de constitution et d’envoi du CD. Retournez pour
cela le formulaire
ainsi que votre
règlement à : Jean-Yves Antoine, IUP
Blois, Antenne Universitaire de Blois, 3 place Jean Jaurès,
41000 BLOIS, France.
Convention
d'utilisation - Licence de distribution
Hormis
les frais d'expédition de CD dans le cadre du corpus avec
fichiers audio, le
corpus OTG est distribué gratuitement sous licence
Creative
Commons CC-BY-SA.
Cela signifie que vous devez respecter le contrat
d’utilisation suivant :
- BY :
paternité
-
Vous devez citer les auteurs de ce corpus pour toute utilisation du
corpus.
Dans le cas d’une publication s’appuyant sur ces
travaux,
nous vous demandons
ainsi de citer les articles référencés
dans la
description de la ressource jointe à la distribution ou dans
la
liste ci-dessous.
- SA :
partage des
conditions initiales à l’identique -
Vous ne pouvez créer une nouvelle ressource à
partir de la ressource existante
et en faire ensuite un usage différent de celui
imposé par ce contrat. Là
encore, nous sommes ouverts à toute utilisation du corpus
pour création de
nouvelles ressources, mais nous vous demandons de nous contacter pour
discuter
de ces nouveaux usages.
Important - Par
ailleurs, malgré tout le soin porté à
l'anonymation des locuteurs, cette
ressource peut intégrer des échanges dont la
communication porte atteinte à
la protection de la vie privée ou portant
appréciation ou jugement de
valeur sur une personne physique nommément
désignée, ou facilement
identifiable, ou qui font apparaître le comportement d'une
personne
dans des conditions susceptibles de lui porter préjudice.
(Code du
Patrimoine, art. L. 213-2, I, 3) . A ce titre, ce corpus peut
être
utilisé à des fins d'analyse,
mais en
aucun cas ne peut être destiné à
d'autres usages donnant lieu par exemple à diffusion
publique....
- Pascale NICOLAS, Sabine
LETELLIER-ZARSHENAS, Igor SCHADLE, Jean-Yves ANTOINE, Jean
CAELEN
(2002). Towards a large corpus of spoken dialogue in French that will
be freely available: the “Parole Publique” project
and its
first realisations. Actes LREC’2002. 3rd european conference
on
language resources and evaluation. Las Palmas de Gran Canaria, Espagne.
Mai 2002

- Jean-Yves
ANTOINE, Sabine LETELLIER-ZARSHENAS, Pascale NICOLAS, Igor SCHADLE (2002).
Corpus OTG et ECOLE_MASSY : vers la constitution d’un
collection
de corpus francophones de dialogue oral diffusés librement.
Actes TALN’2002. Nancy, France. Juin 2002


Ce(tte) œuvre est mise à disposition selon les
termes de la Licence
Creative Commons Attribution - Partage dans les Mêmes
Conditions 3.0 France.