1
00:00:00,160 --> 00:00:10,280 X1:54 Y1:551
...
2
00:00:10,600 --> 00:00:12,200 X1:54 Y1:551
-"ROSETTA" est l'abréviation
3
00:00:12,520 --> 00:00:15,320 X1:54 X2:54 Y1:25 Y2:75
de "Robot de Sous-titrage
Et Toute Traduction Adaptés".
4
00:00:15,640 --> 00:00:18,280 X1:54 X2:216 Y1:25 Y2:75
C'est un projet de recherche
public-privé
5
00:00:18,600 --> 00:00:21,480 X1:72 X2:54 Y1:326 Y2:376
labellisé par Cap Digital
et co-financé par Bpifrance,
6
00:00:21,800 --> 00:00:24,280 X1:90 X2:54 Y1:326 Y2:376
au titre du programme
Investissements d'avenir.
7
00:00:24,600 --> 00:00:27,760 X1:54 X2:54 Y1:501 Y2:551
L'ambition du projet ROSETTA est
de rendre les contenus audiovisuels
8
00:00:28,080 --> 00:00:30,680 X1:126 X2:54 Y1:501 Y2:551
de tous types
plus accessibles aux utilisateurs.
9
00:00:31,000 --> 00:00:31,840 X1:162 Y1:551
Pour cela,
10
00:00:32,160 --> 00:00:35,240 X1:54 X2:90 Y1:501 Y2:551
ROSETTA développe des systèmes
de production automatique
11
00:00:35,560 --> 00:00:38,440 X1:72 X2:72 Y1:501 Y2:551
de sous-titres textuels
multilingues et adaptés.
12
00:00:38,760 --> 00:00:41,360 X1:54 X2:72 Y1:501 Y2:551
ROSETTA propose aussi
à titre exploratoire
13
00:00:41,680 --> 00:00:44,560 X1:108 X2:54 Y1:501 Y2:551
une traduction
en langue des signes française,
14
00:00:44,880 --> 00:00:48,280 X1:90 X2:54 Y1:501 Y2:551
à l'aide de l'animation
d'un avatar 3D signant en LSF.
15
00:00:51,960 --> 00:00:53,280 X1:216 Y1:551
Ce projet se déroule
16
00:00:53,600 --> 00:00:56,960 X1:126 X2:54 Y1:501 Y2:551
sur 3 ans et 6 mois,
et comporte 8 lots complémentaires.
17
00:00:57,280 --> 00:01:00,400 X1:180 X2:90 Y1:326 Y2:376
Le lot 1 est transversal.
Il coordonne la gestion du projet
18
00:01:00,720 --> 00:01:03,800 X1:234 X2:90 Y1:326 Y2:376
et la communication
entre les différents partenaires,
19
00:01:04,120 --> 00:01:06,720 X1:234 X2:198 Y1:326 Y2:376
entreprises privées
et laboratoires publics.
20
00:01:07,040 --> 00:01:09,320 X1:180 X2:54 Y1:326 Y2:376
Le lot 2
vise à collecter et produire
21
00:01:09,640 --> 00:01:11,960 X1:180 X2:54 Y1:326 Y2:376
les corpus
qui vont servir à l'apprentissage
22
00:01:12,280 --> 00:01:14,080 X1:126 X2:72 Y1:501 Y2:551
et l'évaluation
des modèles automatiques.
23
00:01:14,400 --> 00:01:17,920 X1:72 X2:54 Y1:326 Y2:376
Le lot 3 vise à produire,
via des réseaux neuronaux,
24
00:01:18,240 --> 00:01:21,680 X1:72 X2:54 Y1:326 Y2:376
des sous-titres français
adaptés à la diffusion à l'antenne
25
00:01:22,000 --> 00:01:23,560 X1:90 X2:54 Y1:501 Y2:551
et correspondant
à différents publics,
26
00:01:23,880 --> 00:01:25,400 X1:126 X2:72 Y1:501 Y2:551
dont le public
sourd et malentendant.
27
00:01:25,720 --> 00:01:28,400 X1:54 X2:54 Y1:326 Y2:376
Le lot 4 a pour objectif
la production automatique
28
00:01:28,720 --> 00:01:31,600 X1:144 X2:180 Y1:25 Y2:75
de sous-titres multilingues,
grâce à des modèles
29
00:01:31,920 --> 00:01:35,200 X1:54 X2:108 Y1:25 Y2:75
de traduction neuronale spécialisée
pour la tâche de sous-titrage
30
00:01:35,520 --> 00:01:38,280 X1:162 X2:198 Y1:25 Y2:75
du français vers l'anglais,
l'espagnol, l'italien,
31
00:01:38,600 --> 00:01:39,680 X1:54 Y1:551
le portugais et le chinois.
32
00:01:40,680 --> 00:01:44,040 X1:234 X2:126 Y1:25 Y2:75
Le lot 5 est dédié
à la génération d'animation
33
00:01:44,360 --> 00:01:47,960 X1:126 X2:234 Y1:25 Y2:75
d'un avatar 3D signant en LSF,
afin d'expérimenter
34
00:01:48,280 --> 00:01:51,280 X1:126 X2:234 Y1:501 Y2:551
les possibilités de traduction
directement en LSF
35
00:01:51,600 --> 00:01:53,680 X1:90 Y1:551
du contenu de journaux télévisés.
36
00:01:54,000 --> 00:01:58,160 X1:54 X2:72 Y1:326 Y2:376
Le lot 6 vise à évaluer la qualité,
l'utilité et l'utilisabilité
37
00:01:58,480 --> 00:02:00,960 X1:180 X2:162 Y1:25 Y2:75
des modules précédents,
à la fois du point de vue
38
00:02:01,280 --> 00:02:05,240 X1:90 X2:72 Y1:501 Y2:551
d'experts de la traduction en LSF
et de la production de sous-titres
39
00:02:05,560 --> 00:02:08,320 X1:252 X2:126 Y1:501 Y2:551
et d'utilisateurs
avec leurs besoins spécifiques.
40
00:02:08,640 --> 00:02:12,600 X1:54 X2:108 Y1:326 Y2:376
Le lot 7 cherche à anticiper
la réussite du projet,
41
00:02:12,920 --> 00:02:15,960 X1:72 X2:180 Y1:326 Y2:376
en interrogeant les utilisateurs
sur leurs attentes
42
00:02:16,280 --> 00:02:17,520 X1:54 Y1:551
et en positionnant le projet
43
00:02:17,840 --> 00:02:20,000 X1:54 X2:54 Y1:501 Y2:551
par rapports aux besoins
et pratiques existantes.
44
00:02:20,320 --> 00:02:21,360 X1:126 Y1:376
Le lot 8, enfin,
45
00:02:21,680 --> 00:02:24,960 X1:54 X2:126 Y1:326 Y2:376
intègre l'ensemble des modules
dans un démonstrateur.
46
00:02:25,280 --> 00:02:26,280 X1:216 Y1:551
Il valorise le projet
47
00:02:26,600 --> 00:02:28,520 X1:234 X2:180 Y1:501 Y2:551
selon une stratégie
de dissémination commune
48
00:02:28,840 --> 00:02:30,760 X1:288 X2:162 Y1:501 Y2:551
et accompagne
les réalisations du projet
49
00:02:31,080 --> 00:02:32,560 X1:54 Y1:551
dans leur phase d'exploitation.
50
00:02:37,600 --> 00:02:39,840 X1:144 X2:54 Y1:501 Y2:551
ROSETTA s'appuie
sur les développements récents
51
00:02:40,160 --> 00:02:42,960 X1:54 X2:54 Y1:501 Y2:551
de l'intelligence artificielle,
en particulier le "deep learning"
52
00:02:43,280 --> 00:02:44,960 X1:162 X2:54 Y1:501 Y2:551
appliqué
à la traduction automatique.
53
00:02:45,280 --> 00:02:48,320 X1:54 X2:54 Y1:501 Y2:551
Et ce, dans différentes langues
et pour des domaines aussi variés
54
00:02:48,640 --> 00:02:51,080 X1:54 X2:54 Y1:501 Y2:551
que le divertissement,
l'information ou l'apprentissage.
55
00:02:52,440 --> 00:02:55,320 X1:198 X2:90 Y1:501 Y2:551
ROSETTA s'appuie aussi
sur l'enregistrement du mouvement
56
00:02:55,640 --> 00:02:59,160 X1:234 X2:54 Y1:501 Y2:551
par Motion Capture
et une représentation multilinéaire
57
00:02:59,480 --> 00:03:01,880 X1:198 X2:216 Y1:501 Y2:551
de la langue des signes.
Ces outils permettent
58
00:03:02,200 --> 00:03:04,400 X1:180 X2:180 Y1:501 Y2:551
de faire des expériences
au-delà des sous-titres,
59
00:03:04,720 --> 00:03:06,360 X1:126 Y1:551
dans le but de proposer un jour
60
00:03:06,680 --> 00:03:10,400 X1:90 X2:234 Y1:501 Y2:551
un accès aux contenus d'actualité
directement en LSF.
61
00:03:15,760 --> 00:03:18,320 X1:126 X2:90 Y1:501 Y2:551
ROSETTA s'adresse
à 3 cibles directes.
62
00:03:18,640 --> 00:03:21,760 X1:54 X2:108 Y1:501 Y2:551
1) Les utilisateurs finaux :
les personnes sourdes
63
00:03:22,080 --> 00:03:25,800 X1:72 X2:72 Y1:501 Y2:551
ou malentendantes, les personnes
apprenant une langue étrangère
64
00:03:26,120 --> 00:03:27,600 X1:54 Y1:551
ou souhaitant accéder aux contenus
65
00:03:27,920 --> 00:03:29,640 X1:126 X2:54 Y1:501 Y2:551
dans une langue
qu'elles maîtrisent mieux.
66
00:03:29,960 --> 00:03:33,280 X1:54 X2:72 Y1:501 Y2:551
2) Les sociétés et organismes
de production et diffusion
67
00:03:33,600 --> 00:03:35,920 X1:54 X2:144 Y1:501 Y2:551
de contenus numériques,
en particulier
68
00:03:36,240 --> 00:03:38,720 X1:54 X2:54 Y1:501 Y2:551
ceux qui ont une incitation
à produire des sous-titres adaptés
69
00:03:39,040 --> 00:03:40,640 X1:54 X2:90 Y1:501 Y2:551
pour une grande partie
de leurs contenus.
70
00:03:40,960 --> 00:03:44,520 X1:90 X2:54 Y1:501 Y2:551
3) Les administrations,
les services de communication,
71
00:03:44,840 --> 00:03:47,280 X1:180 X2:54 Y1:501 Y2:551
les médias,
les organismes de formation
72
00:03:47,600 --> 00:03:49,480 X1:90 X2:54 Y1:501 Y2:551
et tout producteur
de contenu audiovisuel
73
00:03:49,800 --> 00:03:51,440 X1:144 X2:54 Y1:501 Y2:551
souhaitant
le rendre plus accessible.
74
00:03:56,720 --> 00:03:58,760 X1:54 X2:144 Y1:501 Y2:551
Les perspectives de ROSETTA
sont de 3 ordres.
75
00:04:05,160 --> 00:04:07,040 X1:180 Y1:551
Ensuite...
76
00:04:12,160 --> 00:04:13,160 X1:216 Y1:551
Enfin...
77
00:04:19,560 --> 00:04:24,560 X1:108 Y1:551
france.tv access