Quaero en bref

Coordinateur: Technicolor

Découvrez Quaero en un clic !

Quaero (« je cherche » en latin) est un programme collaboratif d’innovation et de recherche industrielle sur l’analyse automatique et l’enrichissement de contenus numériques, multimédias et multilingues.  Coordonné par Technicolor, ce programme franco-allemand réunit 32 partenaires publics et privés leaders dans leur domaine de recherche.

Le programme est fondé sur une organisation unique autour de trois piliers :

  • huit projets applicatifs, menés par des industriels, qui développent des innovations ciblant les besoins de marchés identifiés ;
  • Une structure de recherche partagée qui facilite le transfert technologique vers les projets applicatifs : le pôle de technologies (CTC) et le projet Corpus associé ;
  • Le principe de coopétition par l’expérimentation comparative qui permet de s’orienter vers les solutions les plus prometteuses.
 
Projets applicatifs
close
 
Evaluation
close
 

Campagnes d’évaluation et coopétition

Quaero a développé un système unique d’évaluation des technologies développées au sein du projet CTC à travers des campagnes annuelles d’expérimentation. Cette évaluation comparative permet d’établir des instruments de mesures fiables dans le domaine du traitement automatique de contenus. Par une mise en concurrence stimulante des partenaires (la coopétition), elle favorise l’émergence des meilleures solutions.

Les campagnes d’évaluation comparative permettent :

  • d’évaluer objectivement, par une tierce partie, les méthodes et modèles développés dans le CTC (Pôle de technologies clés)
  • de s’orienter vers la solution technologique la plus porteuse à destination des projets applicatifs
  • d’intensifier la communication et les échanges de bonnes pratiques entre les partenaires
  • de développer des instruments de mesure et renforcer l’infrastructure d’évaluation en Europe.

Dans ce cadre compétitif, la coopétition permet d’améliorer l’efficacité du projet. Il ne s’agit pas d’une duplication des efforts : au contraire, la coopétition renforce la complémentarité et les échanges de bonnes pratiques entre les acteurs du projet.

 

L’évaluation en chiffres
  • 30 campagnes d’évaluation internes
 
 
Pôle de technologies Corpus
close
 

Le centre de recherche Quaero : le pôle de technologies (CTC)

Le projet « Pôle de technologies » (CTC – Core Technology Cluster) regroupe l’essentiel des activités de recherche amont, au sein des laboratoires académiques et industriels. En lien avec le projet Corpus, il constitue le socle commun de recherche du programme Quaero.

Le CTC joue trois rôles principaux :

  1. améliorer l’état de l’art des technologies d’indexation et de structuration des documents multimédias et multilingues
  2. développer les technologies clés pour les huit projets applicatifs de Quaero
  3. mesurer les progrès lors de campagnes d’expérimentation des technologies dans une dynamique de coopétition.

Le CTC se concentre autour de huit domaines de recherche :

  • le traitement de l’écrit,
  • la traduction,
  • le traitement de la parole,
  • le traitement de l’audio et de la musique,
  • le traitement de l’image et de la vidéo,
  • la structuration multimodale des contenus audiovisuels,
  • les techniques de recherche et de navigation dans des contenus multimédias
  • la protection des données

Le CTC en chiffres
  • 24 partenaires
  • 35 nationalités représentées
  • 75 modules technologiques développés et transférés dans les prototypes applicatifs
  • Plus de 700 publications
  • 50 thèses
  • 70 participations à des campagnes d’évaluation nationales et internationales (classement le plus souvent dans les 3 premiers)
  • 23 campagnes d’évaluation internes
  • 16 distinctions (meilleure publication, prix jeune chercheur, prix de thèse, médaille de Cristal CNRS)
A découvrir
camera Vidéos 
cartes Portraits et interviews 
  • 5 questions à Jean-Luc Gauvain (à venir)
icon_pdf À lire
  • Le CTC : fiche descriptive (à venir)
  • Publications scientifiques
 
 
close
 

La matière première de Quaero : Corpus

Corpus est un projet horizontal du programme Quaero, et qui constitue, avec le CTC, le socle commun de recherche et d’innovation en amont. Corpus apporte la matière première à Quaero : la collecte et l’annotation de données constituent de grands corpus indispensables au traitement automatique de contenus.

Sous la direction de l’Université Technique d’Aix-la-Chapelle (RWTH), le projet Corpus vise à :

  • collecter les données des projets applicatifs, soit une « vérité de terrain » provenant des conditions réelles d’utilisation
  • développer de grands corpus de données multimédias et multilingues (traitement, annotation, validation)
  • alimenter le CTC de données réelles permettant le développement des technologies clés dans les différents domaines (audio, traduction, images, texte, etc.)
  • fournir des données de test pour les campagnes d’expérimentation propres à Quaero

Corpus en chiffres
  • 26 partenaires
  • 1859 heures d’audio transcrites de plusieurs sources en 9 langues
  • 4,6 milliards de mots annotés
  • plusieurs centaines de milliers d’images, dont : 500 000 images par catégories visuelles, 250 000 pages de journaux, 100 millions d’images pour la recherche
  • 1556 heures de vidéos annotées
  • plusieurs corpus mis à libre disposition de la communauté, dont :
    • un corpus vidéo de 800 heures avec 346 concepts pour les évaluations internationales TRECVID
    • une base de données de 518 concepts visuels de 500 000 images (environ 1000 par concept)
    • 2 corpus de textes  pour les challenges internationaux BioNLP 2013 (acquisition ontologique et annotation sémantique)
    • 2 corpus d’1,5 millions de mots chacun, diffusés gratuitement par l’agence ELRA : un issu de données orales radio et télédiffusées, et l’autre de la presse écrite de 1890.
A découvrir
cartes Portraits et interviews

 

icon_pdf À lire
  • Corpus : fiche descriptive (à venir)
  • Publications scientifiques