-->
获得免费通行证,加入我们的流媒体连接-2月19日至22日; 现在注册!

ttconv简化了字幕和字幕

文章特色图片

推荐引擎是很奇怪的东西. 最近,我的妻子接受了从口译和笔译到字幕工作的再培训. 作为一个家庭, 我们总是有字幕/字幕(我们将在稍后公布差异), 因为我女儿有一只耳朵听力严重受损.  

当然, 我的工作是流媒体, 所以我想当大卫·隆卡, 他是Facebook的视频编码总监, 出现在我领英新闻提要的顶部,上面写着:

David Ronca LinkedIn帖子

 

现在, 而我已经在新兴的流媒体视频技术领域工作了25年以上, 字幕一直是我们需要处理的“又一个数据流”,而不是“我必须了解其细节的数据流”.和许多读者一样,我也听说过 .srt和WebVTT,以及 .stl文件. 我将它们与压缩的视频和音频合并,并将它们打包成容器格式,并将它们大量运送给世界各地的观众. 我觉得我对字幕和定时字幕很熟悉.

然后我发现自己, 就在同一天我看到了大卫的帖子, 看着我(相当非技术的)妻子的肩膀,她正在接受使用字幕系统的培训. 我在一个完全专注于优化与特定剪辑和编辑相关的字幕数据的应用程序中看到了编辑决策时间轴上的分钟计时和位置, 我意识到我真的有 不知道 关于字幕格式的细节. 

虽然我们大多数业内人士都可以谈论音频和视频压缩的历史, 以及发行形式, 我们中很少有人 真的 了解市场上的定时文本、协议和数据结构,以及它们存在的原因.

所以我联系了David分享的帖子的作者:Pierre-Anthony Lemieux, 请他给我介绍一下计时文本的细微差别, 并进一步解释ttconv是什么, 以及大卫(和其他人)对此感到兴奋的原因.

皮埃尔-安东尼一直非常专注于时间文本和字幕的细节大约8年. 这是一段有趣的时光. 显然,这些技术可以追溯到许多年前,甚至在互联网在Vint Cerf和Bob Kahn的脑海中成为一个想法之前.  

当然,在早期的一些电影中,文字是至关重要的. 

Intertitle

在默片时代,字幕很重要,原因显而易见. 简单地停止电影, 显示中间标题, 然后回归到节目制作,这就意味着电影的本地化对于国际多语言发行来说真的很简单. 只需简单地翻译和替换字幕,这部电影就能突然吸引更多的全球观众. 对于电影的头20年来说,这是伟大的, 但是到了1927年,声音出现了,这使得字幕在很大程度上是多余的. 所以音频配音(甚至完全重拍)的复杂性!),供多语种读者阅读. 

这导致了滚动字幕的出现,以及最早的提供带有本地化的定时文本的尝试.

在接下来的五六十年间, 本土化是创造限时文本的关键驱动力——新市场和新收益都让额外的制作成本变得物有所值. 直到1980年,美国广播公司,全国广播公司和公共广播公司首次为聋哑人提供封闭字幕 可访问性 也成为了这些技术背后的关键驱动力. 下面列出了不同类型的定时文本的定义, 包括字幕, 字幕, 和更多的.

定时文本包括字幕和封闭字幕

附件B     定时文本定义(规范)

B.1           字幕

字幕是音轨的文本表示, 通常只有对话框,而且通常使用的语言不是音轨对话框, 适合外语读者阅读.

B.2           给听力受损人士的说明文字

听障人士的字幕是音轨的文本表示, 通常包括所有的声音, 通常和音轨对话框使用相同的语言, 专为听力受损的观众设计.

B.3           给视障人士的文字

视障人士文本是对内容的视觉元素的文本描述,通常使用与音频轨道对话框相同的语言, 专为视障人士设计.

B.4           评论

注释提供了有关相关内容的额外信息.g. 制作人评论)通常使用与音轨对话框相同的语言.

B.5           卡拉ok

卡拉ok是歌词的文字表现形式, 通常用与相关歌曲相同的语言.

B.6           强迫的叙述

在媒体上出现的与外国或异域语言或翻译文本有关的定时文本, 例如在一个标志中, 如果没有其他定时文本,则打算显示该文本, 比如字幕或字幕, 启用了.

附件B     定时文本定义(规范)

B.1           字幕

字幕是音轨的文本表示, 通常只有对话框,而且通常使用的语言不是音轨对话框, 适合外语读者阅读.

B.2           给听力受损人士的说明文字

听障人士的字幕是音轨的文本表示, 通常包括所有的声音, 通常和音轨对话框使用相同的语言, 专为听力受损的观众设计.

B.3           给视障人士的文字

视障人士文本是对内容的视觉元素的文本描述,通常使用与音频轨道对话框相同的语言, 专为视障人士设计.

B.4           评论

注释提供了有关相关内容的额外信息.g. 制作人评论)通常使用与音轨对话框相同的语言.

B.5           卡拉ok

卡拉ok是歌词的文字表现形式, 通常用与相关歌曲相同的语言.

B.6           强迫的叙述

在媒体上出现的与外国或异域语言或翻译文本有关的定时文本, 例如在一个标志中, 如果没有其他定时文本,则打算显示该文本, 比如字幕或字幕, 启用了.

(来自SMPTE st2067 -2可互操作主格式-核心约束,(c) SMPTE)

In 1990, 《百家乐软件app最新版下载》要求在电视中安装21线预留和字幕解码器. 但直到1996年,监管部门才认识到听力障碍的观众无法持续地消费视频/电视/电影媒体,并起草了强制要求电视广播必须包含字幕的政策. 直到2010年,政府才强制要求其他形式的视频——那些与我们的行业相关的视频——必须带有字幕.

勒米厄强调,这是全球流媒体平台的出现,而且是全新的, 复杂的本地化要求——这是影响立法格局的关键因素之一.

传统的内容窗口意味着,一部英语电影首先要在英语国家上映,只配英文字幕. 然后, 如果市场需求/反应良好, 外文字幕或配音的额外制作费用将在各地区的基础上增加,因为内容是针对这些国家的.

但是,在上个世纪的大部分时间里,无障碍立法一直是包括定时文本的关键驱动因素, 全球市场力量——1.e.流媒体,再一次扩展了这一点. 进入个人电脑/平板电脑/手机时代(现在说“后疫情”还为时过早?),而如今,许多游戏从一开始就准备好了字幕,支持10种语言. Netflix已经达到了大约30种本地化语言. 

而到了1988年,只有200人左右,已经售出了000套字幕系统, 如今,字幕技术可扩展且成本低廉, 有时作为一个web应用程序, 数以百万计的专业字幕师(就像我的妻子一样,希望很快就能有资格)在无尽的新内容海洋中工作.

定时文本背后的技术

所以在这个过程中, 是时候研究一下技术了:我问了皮埃尔-安东尼一个(故意天真的)有趣的问题:“它不只是一个时间戳和一些ASCII码吗???他的回答是:

是的, 在某种程度上,它是……但是现在有许多遗留系统以特定的方式生成计时文本. 我们有 .由DVD演变而来的srt文件, 我们有SCC和STL,它们是从美国和欧洲的广播广播发展而来的.  我们有卡拉ok专用的格式. 我们有包括定位信息在内的标准,所以当拍摄包含一组说话者时,定时文本也可以覆盖在说话者上. 我们有一些标准,可以使用颜色来进一步帮助观看者在对话流中区分说话者.

当我们看不同的语言, 有明显的“方向性”——一些脚本从右向左读, 甚至是垂直的, 即使在不同的语言中,也有不同的方法. 日文,以及结合垂直/水平文本,可以有可选的 “鲁比' 汉字(furigana)添加到基本的汉字文本中, 这可以帮助缺乏经验的读者找出可能有不同意思的细微发音. 这些角色的位置非常微妙, 但当然需要在定时文本格式中表达,并且经常呈现非常具有挑战性的呈现问题. 

每一个都有自己的生产工作流遗产, 这意味着有许多遗留的工具在广泛使用,并且产生的时间文本数据不适合现代标准化. 许多这些不同的格式在大型内容存档中广泛存在, 并且必须在内容可以重新用于现代工作流程之前进行翻译. 随着媒体使用的变化,对这些定时文本格式的一致性和可移植性的要求也在变化.

这就是 ttconv 进来. Ttconv是一个格式转换器. 我们引入它是为了帮助将遗留格式转换为被广泛采用的W3C标准化的定时文本“通用语言” IMSC 格式.

有了这个对ttconv的有力解释, 以及它所解决的问题,我也跟进了大卫·隆卡.  

我想知道为什么ttconv解决了Facebook的问题(原文来源).  "Ffacebook为观看视频内容提供了一个很好的平台, 而字幕是这个平台的重要组成部分, 启用可访问性和本地化,朗卡说. “而IMSC 1.1是全球字幕的现代格式, 大量的全球视频内容都有遗留格式的字幕. 我们觉得这个行业需要一个现代化的, 用于验证这些遗留字幕格式并将其转换为IMSC 1的高质量开源工具.我们与Pierre和Sandflow合作开发了这个新工具."

如果他看到(同行公司)采用IMSC1的模式.1广泛. 这是一个行业应该更广泛参与的“运动”吗? "IMSC1.1是唯一支持所有全球语言字幕的定时文本模型, 包括复杂格式的字幕和日语等,朗卡说. “我们确实认为,未来所有新的字幕资产都应该在IMSC1中编写.1." 

最后, 我问他们是否有建议给流媒体读者寻求改善定时文本和字幕工作流程端到端. 

"我个人对业内所有人的建议是将他们的工具和工作流程迁移到IMSC 1.1、使用IMSC1.对于所有新创建的字幕资产来说都是如此,”Ronca说. “进一步, 我建议将TTV集成到工作流程中,以确保所有传入和传出的字幕资产符合IMSC1.1规范. 这将最大化字幕的互操作性. 最后,将字幕视为流媒体系统中的一等公民. 要求字幕的质量和QoS与音频和视频相同."

lemiux补充道:“在整个过程中,将计时文本与音频和视频同等对待. 这意味着,例如,定时文本是分销大师的一个组成部分. 投资于定时文本创作实践和格式,让整个世界都能接触到. 这意味着教育上游字幕/字幕提供商和下游平台, 例如, 创建创作指南, 样品, 转换和验证工具(如ttconv), 等." 

总而言之:定时文本并不是聋哑人的“选择”, 或者那些想看外国电影的人:2016年的一项调查显示,Facebook上85%的视频都是关着声音观看的. 所以下次你浏览新闻推送的时候, 或者在嘈杂的酒吧里看体育频道, 但多亏了字幕和字幕,我才能跟上, 停下来思考一下定时文本在日常生活中扮演的微妙但重要的角色. 它确实是我们这个行业的无名英雄.

流媒体覆盖
免费的
合资格订户
现在就订阅 最新一期 过去的问题
相关文章

威瑞森发现,80%的视频字幕用户没有听力障碍

随着越来越多的观众在公共场所通过移动设备观看视频, 说明文字显得更为重要.

如何得分,增强,并说明视频与YouTube创作者工作室

YouTube后台的编辑功能无法与Adobe Premiere Pro等非线性编辑器竞争, 但是有一些强大而独特的工具可以使简单的编辑项目变得更加简单.

新的FCC标题要求:你需要知道的

新的字幕要求于7月1日生效, near-live, 预先录制好的广播视频放到网上.