1 00:00:00,167 --> 00:00:10,626 ... 2 00:00:12,834 --> 00:00:16,083 - Limsi是国家科学研究中心下属的 3 00:00:16,417 --> 00:00:17,459 一所多学科研究实验室。 4 00:00:17,792 --> 00:00:21,125 这些研究领域中, 5 00:00:21,459 --> 00:00:23,626 涉及了语言科学和技术的所有内容, 6 00:00:23,959 --> 00:00:28,500 无论是口语、书面语还是手语。 7 00:00:29,334 --> 00:00:31,667 Limsi还特别参与了一些子项目, 8 00:00:31,999 --> 00:00:35,042 这些项目涉及了 语言资源 9 00:00:35,375 --> 00:00:40,209 或语料库的制定, 以及自动处理模块的开发。 10 00:00:40,542 --> 00:00:45,042 目的是使 为聋哑人和听障人群制定的 11 00:00:45,375 --> 00:00:48,959 字幕自动化, 12 00:00:49,250 --> 00:00:53,500 并提供LSF(法语手语)翻译, 13 00:00:53,834 --> 00:00:56,792 给以手语作为第一语言的聋哑人, 14 00:00:57,083 --> 00:01:00,292 并且对于他们而言, LSF比字幕更加容易理解。 15 00:01:00,626 --> 00:01:03,999 我们特别参与了子项目3和5。 16 00:01:04,292 --> 00:01:05,959 子项目3是一个模块, 17 00:01:06,250 --> 00:01:16,626 它将以视频形式的电视节目作为输入, 并生成合适的字幕作为输出。 18 00:01:16,959 --> 00:01:20,834 子项目5将该生成字幕作为输入, 19 00:01:21,125 --> 00:01:24,250 并以手语动画形式输出LSF 20 00:01:24,584 --> 00:01:27,167 翻译。 21 00:01:27,500 --> 00:01:30,584 目前,我们已经实现了一些基础模块。 22 00:01:31,542 --> 00:01:43,626 对于子项目3这个基础模块, 实质上可以实现对电视节目视频中语音的转录, 23 00:01:44,500 --> 00:01:48,500 也可以对于该转录实现 24 00:01:48,834 --> 00:01:52,626 一个字幕的简化版本。 25 00:01:52,959 --> 00:01:56,250 子项目5是一项更具探索性的 工作, 26 00:01:56,584 --> 00:02:02,042 有关手语自动处理 的研究则比较新。 27 00:02:02,375 --> 00:02:05,500 在这方面, 我们主要参与制作了 28 00:02:05,834 --> 00:02:11,042 手语语料库,该语料库将用于生成动画。 29 00:02:11,375 --> 00:02:15,999 此外,我们还开发了 30 00:02:16,292 --> 00:02:19,626 一个中间表示形式,将在字幕和 31 00:02:19,959 --> 00:02:22,375 手语动画的控制 之间充当枢轴。 32 00:02:22,709 --> 00:02:27,876 现在要做的是完善和组装这些 基础模块, 33 00:02:28,167 --> 00:02:31,417 为了得到端到端的模型, 34 00:02:31,751 --> 00:02:33,250 然后需要评估这些模型, 35 00:02:33,584 --> 00:02:36,876 并将它们 整合到最终的演示器中。 36 00:02:37,167 --> 00:02:42,167 SYSTRAN