1 00:00:00,160 --> 00:00:10,280 X1:54 Y1:551 ... 2 00:00:10,600 --> 00:00:12,200 X1:54 Y1:551 -"ROSETTA" est l'abréviation 3 00:00:12,520 --> 00:00:15,320 X1:54 X2:54 Y1:25 Y2:75 de "Robot de Sous-titrage Et Toute Traduction Adaptés". 4 00:00:15,640 --> 00:00:18,280 X1:54 X2:216 Y1:25 Y2:75 C'est un projet de recherche public-privé 5 00:00:18,600 --> 00:00:21,480 X1:72 X2:54 Y1:326 Y2:376 labellisé par Cap Digital et co-financé par Bpifrance, 6 00:00:21,800 --> 00:00:24,280 X1:90 X2:54 Y1:326 Y2:376 au titre du programme Investissements d'avenir. 7 00:00:24,600 --> 00:00:27,760 X1:54 X2:54 Y1:501 Y2:551 L'ambition du projet ROSETTA est de rendre les contenus audiovisuels 8 00:00:28,080 --> 00:00:30,680 X1:126 X2:54 Y1:501 Y2:551 de tous types plus accessibles aux utilisateurs. 9 00:00:31,000 --> 00:00:31,840 X1:162 Y1:551 Pour cela, 10 00:00:32,160 --> 00:00:35,240 X1:54 X2:90 Y1:501 Y2:551 ROSETTA développe des systèmes de production automatique 11 00:00:35,560 --> 00:00:38,440 X1:72 X2:72 Y1:501 Y2:551 de sous-titres textuels multilingues et adaptés. 12 00:00:38,760 --> 00:00:41,360 X1:54 X2:72 Y1:501 Y2:551 ROSETTA propose aussi à titre exploratoire 13 00:00:41,680 --> 00:00:44,560 X1:108 X2:54 Y1:501 Y2:551 une traduction en langue des signes française, 14 00:00:44,880 --> 00:00:48,280 X1:90 X2:54 Y1:501 Y2:551 à l'aide de l'animation d'un avatar 3D signant en LSF. 15 00:00:51,960 --> 00:00:53,280 X1:216 Y1:551 Ce projet se déroule 16 00:00:53,600 --> 00:00:56,960 X1:126 X2:54 Y1:501 Y2:551 sur 3 ans et 6 mois, et comporte 8 lots complémentaires. 17 00:00:57,280 --> 00:01:00,400 X1:180 X2:90 Y1:326 Y2:376 Le lot 1 est transversal. Il coordonne la gestion du projet 18 00:01:00,720 --> 00:01:03,800 X1:234 X2:90 Y1:326 Y2:376 et la communication entre les différents partenaires, 19 00:01:04,120 --> 00:01:06,720 X1:234 X2:198 Y1:326 Y2:376 entreprises privées et laboratoires publics. 20 00:01:07,040 --> 00:01:09,320 X1:180 X2:54 Y1:326 Y2:376 Le lot 2 vise à collecter et produire 21 00:01:09,640 --> 00:01:11,960 X1:180 X2:54 Y1:326 Y2:376 les corpus qui vont servir à l'apprentissage 22 00:01:12,280 --> 00:01:14,080 X1:126 X2:72 Y1:501 Y2:551 et l'évaluation des modèles automatiques. 23 00:01:14,400 --> 00:01:17,920 X1:72 X2:54 Y1:326 Y2:376 Le lot 3 vise à produire, via des réseaux neuronaux, 24 00:01:18,240 --> 00:01:21,680 X1:72 X2:54 Y1:326 Y2:376 des sous-titres français adaptés à la diffusion à l'antenne 25 00:01:22,000 --> 00:01:23,560 X1:90 X2:54 Y1:501 Y2:551 et correspondant à différents publics, 26 00:01:23,880 --> 00:01:25,400 X1:126 X2:72 Y1:501 Y2:551 dont le public sourd et malentendant. 27 00:01:25,720 --> 00:01:28,400 X1:54 X2:54 Y1:326 Y2:376 Le lot 4 a pour objectif la production automatique 28 00:01:28,720 --> 00:01:31,600 X1:144 X2:180 Y1:25 Y2:75 de sous-titres multilingues, grâce à des modèles 29 00:01:31,920 --> 00:01:35,200 X1:54 X2:108 Y1:25 Y2:75 de traduction neuronale spécialisée pour la tâche de sous-titrage 30 00:01:35,520 --> 00:01:38,280 X1:162 X2:198 Y1:25 Y2:75 du français vers l'anglais, l'espagnol, l'italien, 31 00:01:38,600 --> 00:01:39,680 X1:54 Y1:551 le portugais et le chinois. 32 00:01:40,680 --> 00:01:44,040 X1:234 X2:126 Y1:25 Y2:75 Le lot 5 est dédié à la génération d'animation 33 00:01:44,360 --> 00:01:47,960 X1:126 X2:234 Y1:25 Y2:75 d'un avatar 3D signant en LSF, afin d'expérimenter 34 00:01:48,280 --> 00:01:51,280 X1:126 X2:234 Y1:501 Y2:551 les possibilités de traduction directement en LSF 35 00:01:51,600 --> 00:01:53,680 X1:90 Y1:551 du contenu de journaux télévisés. 36 00:01:54,000 --> 00:01:58,160 X1:54 X2:72 Y1:326 Y2:376 Le lot 6 vise à évaluer la qualité, l'utilité et l'utilisabilité 37 00:01:58,480 --> 00:02:00,960 X1:180 X2:162 Y1:25 Y2:75 des modules précédents, à la fois du point de vue 38 00:02:01,280 --> 00:02:05,240 X1:90 X2:72 Y1:501 Y2:551 d'experts de la traduction en LSF et de la production de sous-titres 39 00:02:05,560 --> 00:02:08,320 X1:252 X2:126 Y1:501 Y2:551 et d'utilisateurs avec leurs besoins spécifiques. 40 00:02:08,640 --> 00:02:12,600 X1:54 X2:108 Y1:326 Y2:376 Le lot 7 cherche à anticiper la réussite du projet, 41 00:02:12,920 --> 00:02:15,960 X1:72 X2:180 Y1:326 Y2:376 en interrogeant les utilisateurs sur leurs attentes 42 00:02:16,280 --> 00:02:17,520 X1:54 Y1:551 et en positionnant le projet 43 00:02:17,840 --> 00:02:20,000 X1:54 X2:54 Y1:501 Y2:551 par rapports aux besoins et pratiques existantes. 44 00:02:20,320 --> 00:02:21,360 X1:126 Y1:376 Le lot 8, enfin, 45 00:02:21,680 --> 00:02:24,960 X1:54 X2:126 Y1:326 Y2:376 intègre l'ensemble des modules dans un démonstrateur. 46 00:02:25,280 --> 00:02:26,280 X1:216 Y1:551 Il valorise le projet 47 00:02:26,600 --> 00:02:28,520 X1:234 X2:180 Y1:501 Y2:551 selon une stratégie de dissémination commune 48 00:02:28,840 --> 00:02:30,760 X1:288 X2:162 Y1:501 Y2:551 et accompagne les réalisations du projet 49 00:02:31,080 --> 00:02:32,560 X1:54 Y1:551 dans leur phase d'exploitation. 50 00:02:37,600 --> 00:02:39,840 X1:144 X2:54 Y1:501 Y2:551 ROSETTA s'appuie sur les développements récents 51 00:02:40,160 --> 00:02:42,960 X1:54 X2:54 Y1:501 Y2:551 de l'intelligence artificielle, en particulier le "deep learning" 52 00:02:43,280 --> 00:02:44,960 X1:162 X2:54 Y1:501 Y2:551 appliqué à la traduction automatique. 53 00:02:45,280 --> 00:02:48,320 X1:54 X2:54 Y1:501 Y2:551 Et ce, dans différentes langues et pour des domaines aussi variés 54 00:02:48,640 --> 00:02:51,080 X1:54 X2:54 Y1:501 Y2:551 que le divertissement, l'information ou l'apprentissage. 55 00:02:52,440 --> 00:02:55,320 X1:198 X2:90 Y1:501 Y2:551 ROSETTA s'appuie aussi sur l'enregistrement du mouvement 56 00:02:55,640 --> 00:02:59,160 X1:234 X2:54 Y1:501 Y2:551 par Motion Capture et une représentation multilinéaire 57 00:02:59,480 --> 00:03:01,880 X1:198 X2:216 Y1:501 Y2:551 de la langue des signes. Ces outils permettent 58 00:03:02,200 --> 00:03:04,400 X1:180 X2:180 Y1:501 Y2:551 de faire des expériences au-delà des sous-titres, 59 00:03:04,720 --> 00:03:06,360 X1:126 Y1:551 dans le but de proposer un jour 60 00:03:06,680 --> 00:03:10,400 X1:90 X2:234 Y1:501 Y2:551 un accès aux contenus d'actualité directement en LSF. 61 00:03:15,760 --> 00:03:18,320 X1:126 X2:90 Y1:501 Y2:551 ROSETTA s'adresse à 3 cibles directes. 62 00:03:18,640 --> 00:03:21,760 X1:54 X2:108 Y1:501 Y2:551 1) Les utilisateurs finaux : les personnes sourdes 63 00:03:22,080 --> 00:03:25,800 X1:72 X2:72 Y1:501 Y2:551 ou malentendantes, les personnes apprenant une langue étrangère 64 00:03:26,120 --> 00:03:27,600 X1:54 Y1:551 ou souhaitant accéder aux contenus 65 00:03:27,920 --> 00:03:29,640 X1:126 X2:54 Y1:501 Y2:551 dans une langue qu'elles maîtrisent mieux. 66 00:03:29,960 --> 00:03:33,280 X1:54 X2:72 Y1:501 Y2:551 2) Les sociétés et organismes de production et diffusion 67 00:03:33,600 --> 00:03:35,920 X1:54 X2:144 Y1:501 Y2:551 de contenus numériques, en particulier 68 00:03:36,240 --> 00:03:38,720 X1:54 X2:54 Y1:501 Y2:551 ceux qui ont une incitation à produire des sous-titres adaptés 69 00:03:39,040 --> 00:03:40,640 X1:54 X2:90 Y1:501 Y2:551 pour une grande partie de leurs contenus. 70 00:03:40,960 --> 00:03:44,520 X1:90 X2:54 Y1:501 Y2:551 3) Les administrations, les services de communication, 71 00:03:44,840 --> 00:03:47,280 X1:180 X2:54 Y1:501 Y2:551 les médias, les organismes de formation 72 00:03:47,600 --> 00:03:49,480 X1:90 X2:54 Y1:501 Y2:551 et tout producteur de contenu audiovisuel 73 00:03:49,800 --> 00:03:51,440 X1:144 X2:54 Y1:501 Y2:551 souhaitant le rendre plus accessible. 74 00:03:56,720 --> 00:03:58,760 X1:54 X2:144 Y1:501 Y2:551 Les perspectives de ROSETTA sont de 3 ordres. 75 00:04:05,160 --> 00:04:07,040 X1:180 Y1:551 Ensuite... 76 00:04:12,160 --> 00:04:13,160 X1:216 Y1:551 Enfin... 77 00:04:19,560 --> 00:04:24,560 X1:108 Y1:551 france.tv access