Objectif : collecter et produire des corpus qui seront utilisés pour l’apprentissage, la réalisation et l’évaluation des modèles de production automatique de sous-titres adaptés, de sous-titres multilingues et de LSF (Langue des signes Française).
Sous la responsabilité de France.TV access, ce lot consiste à collecter les ressources langagières utilisées dans les lots 3, 4 et 5.
Ces ressources seront constituées de corpus déjà existants et utilisables dans le contexte du projet, provenant d’émissions télévisées sous-titrées ou intégrant un doublage en LSF, issues aussi des schémas créés par les traducteurs sourds pour le passage du français écrit à la LSF vidéo, et des corpus de recherche.
Elles seront complétées par l’enregistrement par MOCAPLAB d’un corpus 3D de LSF de mouvements nécessaires pour l’animation de signeurs virtuels, ainsi qu’un corpus de schémas de traduction produits par les traducteurs sourds sollicités durant le projet .