ELRA diffuse deux corpora Quaero

Deux corpora Quaero disponibles dans le catalogue des Ressources Linguistiques d’ELRA

Les ressources linguistiques QUAERO « Entités nommées structurées » sont maintenant disponibles dans le catalogue d’ELRA.
Deux Corpora du programme, un corpus de presse écrite et un corpus d’actualités télé-radio-diffusées, annotés en entités nommées structurées, sont maintenant distribués (en accès libre pour la recherche académique) :
  • ELRA-W0073 Corpus Quaero de presse ancienne étendu en entités nommées

Le corpus Quaero de presse ancienne étendu en entités nommées consiste en l’annotation manuelle de 76 numéros de journaux, publiés en 1890-1891 et fournis par la Bibliothèque Nationale de France. Trois publications sont utilisées (Le Temps, La Croix et Le Figaro) pour un total de 295 pages.

Le corpus est annoté manuellement dans son intégralité selon la définition étendue et structurée d’entités nommées Quaero, qui distingue les “types” et les “composants” d’entités.

Plus d’informations sur ce corpus : http://catalog.elra.info/product_info.php?products_id=1194

  • ELRA-S0349 Corpus Quaero d’actualités télé-radio-diffusées annoté en entités nommées

Le corpus Quaero d’émissions télé-radio-diffusées annoté en entités nommées consiste en l’annotation manuelle (i) du corpus ESTER 2 (voir ELRA-S0338) et (ii) du corpus d’évaluation de systèmes de reconnaissance de la parole Quaero (les transcriptions manuelles et automatiques provenant de 3 systèmes de reconnaissance automatique de la parole différents).

Le corpus est entièrement annoté manuellement selon la définition étendue et structurée d’entités nommées Quaero, qui distingue les “types” et les “composants” d’entités.
Plus d’information sur ce corpus : http://catalog.elra.info/product_info.php?products_id=1195

Ces deux corpora sont décrits dans :

S. Rosset, C. Grouin, K. Fort, O. Galibert, J. Kahn, P. Zweigenbaum. „Structured Named Entities in two distinct press corpora: Contemporary Broadcast News and Old Newspapers” In Proc. of LAW VI, 2012.

Pour plus d’informations sur le catalogue, veuillez contacter Valérie Mapelli mailto:mapelli@elda.org

Catalogue en ligne d’ELRA : http://catalog.elra.info/index.php?language=fr
Catalogue Universel d’ELRA : http://universal.elra.info
Archives des mises à jour du Catalogue de Ressources linguistiques d’ ELRA : http://www.elra.info/LRs-Announcements.html



Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>