Vers une pédagogie inclusive : une classification multimodale des illustrations de manuels scolaires pour des environnements d'apprentissage adaptés.
Utiliser l'explicabilité des modèles pour mettre en évidence les expressions genrées dans la parole.
Cross-Modal Retrieval for Knowledge-Based Visual Question Answering.
Classification automatique de données déséquilibrées et bruitées : application aux exercices de manuels scolaires.
Recherche cross-modale pour répondre à des questions visuelles.
Multimodal Inverse Cloze Task for Knowledge-Based Visual Question Answering.
Noisy and Unbalanced Multimodal Document Classification: Textbook Exercises as a Use Case.
TIB: A Dataset for Abstractive Summarization of Long Multimodal Videoconference Records.
Layout and Activity-based Textbook Modeling for Automatic PDF Textbook Extraction.
Un jeu de données pour répondre à des questions visuelles à propos d'entités nommées en utilisant des bases de connaissances (ViQuAE, a Dataset for Knowledge-based Visual Question Answering about Named Entities).
ViQuAE, a Dataset for Knowledge-based Visual Question Answering about Named Entities.
Textual Analysis for Video Memorability Prediction.
Bazinga! A Dataset for Multi-Party Dialogues Structuring.
Détection de scènes remarquables dans un contexte des séries TV.
Vision and Multi-modal Transformers.
Scene Linking Annotation and Automatic Scene Characterization in TV Series.
« Hé Manu, tu descends ? » : identification nommée du locuteur dans les dialogues.
PLUMCOT at TRECVid Instance Search 2018.
ODESSA/PLUMCOT at Albayzin Multimodal Diarization Challenge 2018.
Multimodal Person Discovery in Broadcast TV at MediaEval 2016.
LIMSI @ MediaEval SED 2014.
TVD: A Reproducible and Multiply Aligned TV Series Dataset.
Investigating domain-independent nlp techniques for precise target selection in video hyperlinking.
Multimedia information seeking through search and hyperlinking.
HITS and IRISA at MediaEval 2013: Search and Hyperlinking Task.
Graph-based Local Coherence Modeling.
Enhancing lexical cohesion measure with confidence measures, semantic relations and language model interpolation for multimedia spoken content topic segmentation.
IRISA at MediaEval 2012: Search and Hyperlinking Task.
Structuration automatique de flux télévisuels.
Exploiting Speech for Automatic TV Delinearization: From Streams to Cross-Media Semantic Navigation.
A Scalable Video Search Engine Based on Audio Content Indexing and Topic Segmentation
Accounting for Prosodic Information to Improve ASR-Based Topic Tracking for TV Broadcast News.
Utilisation de relations sémantiques pour améliorer la segmentation thématique de documents télévisuels.
Improving ASR-based topic segmentation of TV programs with confidence measures and semantic relations.
Can Automatic Speech Transcripts Be Used for Large Scale TV Stream Description and Structuring?
Recherche d'information textuelle et phonétique pour le contrôle de l'étiquetage automatique d'émissions dans un flux télévisuel.
