ITU-T-REC-G.1080-IPTV的体验质量(QoE)要求(五)

 

附录 III 与指定的临时性能参数有关的补充信息

(此附录并非本建议书不可分割的一部分)

III.I 介绍

第6章的各种表格所列出的临时参数是基于诸多考虑的,其中包括行业最佳实践(例如有线电视实验室规范、编码器供应商指引)、有竞争力的系统的性能(例如有线电视、卫星电视基准)、电信运营商的部署经验以及本文档发表时的编码技术水平(例如H.262、H.264、 SMPTE 421M、AVS商业产品)。第6章的表格中每个编解码器的最低比特率是实现足够质量的目标值,并非所有编解码器都在本文档发表时达到了这些目标。

III.1 标清电视 (SDTV): 一般最低目标

表6-1包含了MPEG基本流层的临时视频应用层性能要求,这些要求先于用来广播SDTV(480i / 576i)的IP封装。

关于表6-1,用到了如下假设:
源素材:

• NTSC 或 PAL/SECAM
• 4:3 宽高比
• 可以以模拟或数字形式进入前端

最大可视分辨率:

• 横向 x 纵向: 720 像素 x 480 线(NTSC) [ITU-R BT.601-6] 或720 像素 x 576线 (PAL)
• 低分辨率 (例如 ¾ 水平 或 ½ 水平 – 所谓的 ½ D1) 可能被用来保证复杂素材的编码质量

帧率:

• 29.97 fps (NTSC) 或 25 fps (PAL/SECAM)
• 23.97 / 24 fps 也可能用于基于电影的素材(NTSC 通过3:2下拉转换为 30 fps( with 3:2 pull-down for NTSC conversion to 30 fps))
• 每帧两个隔行扫描场


SDTV 视频比特率注意事项
一个特定的视频编解码器所实现的比特率在初次引入后会进行持续的改进,H.262就是这种情况,自其在20世纪90年代中期实现商品化以来,就遵循着麦肯定律进行着不断地改进,而麦肯定律指出编码器的比特率每年可以在保证相同质量的前提下降低约15%。大多数情况下,编码器的改进是在现有标准的范围内进行的,因此不需要升级解码器。

表6-1中示明的H.262比特率已经接近麦肯定律所说的改善周期的尾声,所以一个系统可以使用更低的比特率(特别是经过了专用的预处理后)。最低比特率必须能够满足各IPTV服务环境中确定的所有要求。需要注意的是,在支持更高带宽的接入网(例如光纤、数字有线电视和卫星电视)上提供的服务会专门为含有高复杂度图像内容的广播素材(如体育)使用更高的比特率和VBR编码。

H.264、SMPTE 421M和AVS编解码器(2005年成为SDTV商用广播系统、2006年成为HDTV商用广播系统)更新,同样也会在未来得到改进,不过也许不会像麦肯定律所说的每年15%那么激进。表6-1中的最低比特率示例代表了当前的商用编码器水平,并且假设H.264、 SMPTE 421M和AVS具有相似的质量/比特率性能。

表6-2包含了标清音频源的音频应用层临时性能要求。

关于表 6-2,用到了如下假设:
源素材:

 

• NTSC 或 PAL/SECAM
• 源素材可以包含多个立体声音轨,以支持多语言或环绕声效果,除非在表6-2中有明确指出,否则建议的最小比特率只适用于单一立体声对。
音频声道:
• 许多广播商也将5.1(多达六声道)环绕声应用于黄金时段的节目和特殊内容,尤其是音乐会和体育赛事。

音频采样率:

 

 

• Dolby digital (AC-3): 48 kHz 采样率
• MPEG-2 Audio Layer III (MP3): 16 kHz - 24 kHz
• MPEG-1 Audio Layer III (MP3):32 kHz - 44.1 kHz
• 32 kHz, 44.1 kHz or 48 kHz for MPEG-1 Audio Layer II as per [b_ETSI TR 101 154]
• AAC:48 kHz


通常来说,所选择的音频编解码器应该与部属地的行业标准相匹配以保证与客户接收机的最大兼容。在全球范围内,尤其是北美地区(例如ATSC),对Dolby Digital 5.1的支持逐渐成为一种总体趋势,这对于基于DVB的系统来说也是一个不错的选择。比特率应该与原始素材质量相匹配并且尽量避免格式之间的转码。为支持音乐服务也提供了一个MP3目标。

表6-3包含了视音频同步的临时要求,这些要求基于ATSC为SDTV节目素材所提供的指导方针。视音频同步要求的确定必须要满足各IPTV服务环境的所有要求,需要注意的是,要求的不对称性来自于音频先于视频时的不自然感(因为光速比声速要快)。

ITU-R BT.1359-1建议书就视频和音频的相对时序问题展开了深入的讨论,并且基于在日本、瑞士和澳大利亚进行的主观评价,指明了NTSC和PAL系统中电视素材声音/视觉时序错误的可接受阈值和可察觉阈值。平均来说,其中可察觉阈值约为45ms(音频先于视频)到125ms(音频后于视频),可接受阈值约为90ms(音频先于视频)到185ms(音频后于视频)。其他的标准制定组织(SDO),例如EBU,对视音频的同步有不同的要求。

不同频道之间不一致的声音响度级会对QoE造成负面影响,建议服务供应商使用能保证全频道范围内具有相似响度级的前端设备。另一个超出本文档讨论范围的音频质量问题是发生在STB和TV之间链路的动态范围压缩。

 

 

III.2 标清电视(SDTV): VoD 和付费内容目标

标清格式下的视频点播(VoD)和其他付费内容(例如按次付费服务)与常规的广播材料拥有相似的应用层性能因子。但是,订户的期望可能会更高,因为他们为获得内容付出了额外的费用,并且他们会与其他替代选项(alternative delivery options)进行比较。对于VoD来说,用户会将内容与通过数字有线电视系统交付的VoD素材进行对比,甚至会与DVD中的内容进行比较。

北美地区的VoD应用层参数是由有线电视实验室(CableLabs [CLVoD2])确定的。鉴于大量现有的VoD内容都符合有线电视运营商所使用的参数,而且客户会比较各服务的质量水平,所以建议基于电信的视频内容服务供应商将这些参数作为最低指导方针。目前的指导方针被限制于H.262编码,对于用H.264、SMPTE 421M或 AVS编码的VoD素材,考虑到这些编码器当前的商业部署状态,建议在它们的比特率方面做一个1.5倍的改进(Recommendations for H.264, SMPTE 421M, or AVS encoded VoD materials assume a 1.5x improvement in bit rate as an example, aligned with the state of commercial deployments of these encoders. )。

关于表 6-4, 用到了如下假设:

源素材:

 

 

• NTSC 或 PAL/SECAM
• 4:3 宽高比
• 通过使用多通道系统,可以在线下进行存储内容(例如VoD节目资产)的编码。

最小可视分辨率:

 

 

• 水平 x 垂直: 允许使用1/2 D1 352 像素 x 480 线 (NTSC) [b ITU-R BT.601-6] 或 352 像素 x 576 线 (PAL/SECAM) 来保证复杂素材的编码质量
• 但是,对于有线电视系统,建议使用¾ D1 分辨率(528x480 / 528x576)( However, it’s recommended that be used where possible to align with the maximum specified for cable systems)
• 电信服务供应商可以以全D1分辨率运行VoD节目资产,但很可能无法重新使用为电缆部署而进行预编码的节目资产。

帧率:

 

 

• 29.97 fps (NTSC) 或25 fps (PAL/SECAM)
• 23.97 / 24 fps 也可能用于基于电影的素材(NTSC 通过3:2下拉转换为 30 fps( with 3:2 pull-down for NTSC conversion to 30 fps))
• 每帧两个隔行扫描场


VoD 和付费内容的标清电视视频比特率注意事项

 

 

• 实际的比特率要求必须单独确定以满足各IPTV服务环境的所有要求
• H.262的比特率基于VoD内容的常用值,并且符合目前可用的大多数VoD节目资产
• H.264、 SMPTE 421M和AVS 比特率是从H.262 推导得出的,其中使用了一个1.5x 因子
• 大多数常见H.262编码 VoD 资产的视音频总比特率为 3.75 Mbits/s
• 一个VoD服务的QoE也可能受特技模式功能实现质量的影响,例如快进和快退,这些模式应该尽可能地流畅。如果可能的话,在特技模式中还应该包含有清晰的音频。


表 6-5 包含了VoD和付费内容的临时推荐音频编解码器和比特率。

在表 6-5中假设采样率为 48 kHz。

 

 

III.3 高清电视(HDTV): 目标

表6-6包含了HDTV (720p / 1080i)广播的视频应用层性能临时建议最低目标。

关于表 6-6,用到了如下假设:
源素材:

 

 

• ATSC 或 DVB
• 16:9宽高比
• 源素材以数字格式形式进入前端
分辨率和帧率:
• 720p60 (例如SMPTE 296M)或 720p50 (DVB)

 

- 水平 x 垂直: 1280 像素 x 720线
- 每秒50, 59.94, 60逐行扫描帧
• 1080i60 (例如SMPTE 274M) 或 1080i50 (DVB)
- 水平 x 垂直: 1920 像素 x 1080 线
- 每秒29.97 (59.94i), 30 (60i) 隔行扫描帧,每帧两场


HDTV 视频比特率注意事项
视频编解码器所实现的比特率在初次引入后会进行持续的改进,对于SDTV,这种改进通常会遵循麦肯定律[b_McCannLaw]。

表6-6中示明的H.262比特率已经接近改善周期的尾声,所以一个系统可以使用更低的比特率(特别是经过了专用的预处理后)。比特率的值必须能够满足各IPTV服务环境中确定的所有要求。需要注意的是,在支持更高带宽的接入网(例如光纤、数字有线电视和卫星电视)上提供的服务会专门为含有高复杂度图像内容的广播素材(如体育)使用更高的比特率和VBR编码。

H.264、SMPTE 421M和AVS编解码器(2005年成为SDTV商用广播系统、2006年成为HDTV商用广播系统)更新,同样也会在未来得到改进。表6-1中的最低比特率示例代表了当前的商用编码器水平,但是随着编码器技术的改进,人们希望能以更低的比特率实现令人满意的质量。表6-6列出了H.264的主型,但是随着高型编码器和与之兼容的机顶盒的出现,服务供应商也可以选择利用高型所带来的优越性能。表6-6还假设H.264、SMPTE 421M和AVS拥有相似的质量/比特率性能。

表6-7包含了高清音频资源的音频应用层临时性能要求,通常来说,表6-7所包含的临时参数都是在行业最佳实践、有竞争力的系统的性能(例如有线电视、卫星电视基准)、电信运营商的部署经验以及本文档发表时的编码技术水平的指导下得出的。

关于表 6-7, 用到了如下假设:

源素材:

 

• ATSC 或 DVB
• 源素材可能包含多个音频轨以支持多语言应用
• 可能的情况下,要提供环绕声效果所需的多轨音频
• 音频轨:
• 许多广播商也将5.1环绕声应用于黄金时段的节目和特殊内容,尤其是音乐会和体育赛事。
• 音频采样率:
• MPEG-1 (or -2) Audio Layer II:44.1 kHz 或 48 kHz
• Dolby digital (AC-3): 48 kHz 采样率
• MPEG-2 Audio Layer III (MP3): 16 kHz - 48 kHz
• MPEG-1 Audio Layer III (MP3):32 kHz - 48 kHz
• 32 kHz, 44.1 kHz or 48 kHz for MPEG-1 Audio Layer II as per [b_ETSI TR 101 154]


HDTV 音频比特率注意事项
通常来说,所选择的音频编解码器应该与部属地的行业标准相匹配以保证与客户接收机的最大兼容。在全球范围内,尤其是北美地区(例如ATSC),对Dolby Digital 5.1的支持逐渐成为一种总体趋势,这对于基于DVB的系统来说也是一个不错的选择。比特率应该与原始素材质量相匹配并且尽量避免格式之间的转码。为支持音乐服务也提供了一个MP3目标。

 

 

 

HDTV的A/V同步要求目前正在由ATSC等机构研究中,在此之前,HDTV素材也应遵循表6-3中提供的针对于SDTV的指导方针

 

 

 

附录 IV  影响质量的传输损伤

(此附录并非本建议书不可分割的一部分)

IV.1 介绍

网络传输的关键衡量标准包括损失、时延和抖动(见附录I)。通常来说,由于机顶盒拥有去抖动缓冲区,所以合理的端到端时延和抖动值不是问题,前提是去抖动缓冲区的大小配置与网络和视频分量性能相匹配。然而,视频流对信息损失非常敏感,对QoE的影响相应地也与许多变量有关,包括:

 

• 高度依赖于所损失的数据类型

- 系统信息和报头的损失会产生不同的损伤

- I帧和P帧丢失的数据由于会造成误差传播而比B帧分组丢失造成的损伤更严重

• 依赖于所用的编解码器

• 依赖于所用的MPEG 传输流分组

• Loss distance and loss profile

• 编码比特率越高,数据流对分组损失造成的损伤越敏感

- 对于相同的丢包率,码率高的视频流更易发生因损失造成的损伤(也就是说单位时间内可见的错误越多),因为码率高的视频流中每秒传输的分组更多并且每个分组被影响的概率相同

• 解码器隐藏算法可以减轻一些损失造成的感知影响


在视频比特流中的一个错误或一系列错误会造成不同程度的影响,可能根本觉察不到,也可能是视频或音频信号的彻底损失,这取决于丢失的是什么以及实施时的鲁棒性。图IV.1展示了单一IP分组(包含7个MPEG传输流数据包)丢失(丢失的信息来自于I帧或B帧)对一个视频帧造成的影响示例。我们可以看到,由于I帧在后续P帧和B帧的压缩中起关键作用,所以I帧的损伤传播时间达到了14帧,也就是几乎半秒(假设每帧33ms)的时间。如果丢失的分组影响的是B帧,其损伤只会影响这一帧(33ms),因为编解码器不会采用B帧进行帧间预测编码。需要注意的是,在这个示例中,解码器端没有运行损失隐藏算法。

图 IV.1:单个IP分组丢失的影响示例(左图为B帧,右图为I帧)

下面的表格展示了为达到各种视频服务令人满意的服务质量目标所需的IP数据包传输丢失和抖动要求阈值的最低要求,同时也指明了相关的假设。

网络延迟和抖动应该匹配于机顶盒抖动缓冲区配置(等待时间和缓冲区大小)及网络整体设计,因此在不同的实现之间会有不同。网络抖动必须小于去抖动缓冲区的大小;超出限制的时延偏差会表现为损失。不断增加的缓冲也会对频道切换延迟这样的特性造成负面影响,所以在理想情况下,去抖动缓冲区应该尽可能地小。抖动的目标值设置要基于运营商的经验和机顶盒的缓冲能力。

在IETF RFC3357的单向损失模式示例指标中,数据包损失的目标值是从损失时间和损失距离两方面进行描述的。损失距离即连续网络数据包丢失或错误事件之间的间隔;损失时间即为丢失或错误事件的持续时间(以及这段时间内丢失了多少数据包)。表格中的损失率则是在没有或只有最少的损失隐藏的假设下设计的用来确保令人满意的终端用户服务水平质量的目标。如果网络基础设施的性能低于要求水平,服务供应商可能会用到DSLF TR126的附录II-错误保护机制中所描述的网络层技术(例如交错和FEC)和应用层机制(例如损失隐藏、应用层FEC、自动重发请求(ARQ))来实现要求的性能水平。此外,这些技术的使用可能会改善体验质量,超越竞争对手提供的服务。

理想的最大损失时间应该对应于一个IP数据包,因为随机的比特错误或少量的拥塞常常会导致损失时间为一个数据包的孤立损失事件,而这些孤立损失事件就足以造成如图IV.1所示的非常明显的损伤。但是,在一些会发生循环损伤或FEC的物理层上(例如DSL),或发生大量拥塞的情况下,会产生持续几十毫秒的损失,我们也需要考虑到这种情况。这种类型的损失事件根据下表所示的不同视频流比特率会导致不同数量的数据包丢失。这里的最大损失时间目标是临时设置的,直到将来的研究能在考虑到不同的物理层、保护机制和优化机制的前提下更好地调整最大允许损失时间。

此外,在一些情况下,如DSL调制解调器重新同步或IGP在没有其他保护机制时的收敛(例如MPLS快速路由、快速IGP收敛),会发生持续数十秒的损失事件。这样的事件已经不能算作是服务质量缺陷,而应该被认为是服务中断,一个IPTV系统也无法奢望在发生这样的事件时还能维持正常的服务。

视频应用应该能够在存在正常运行缺陷的情况下正常运行。一个正常的操作考虑就是网络中的保护切换机制的操作。SONET/SDH保护切换机制可能会导致一个持续大约50ms(举例)的潜在数据包丢失时间。对于其他的保护机制(例如MPLS快速重路由、快速IGP收敛),潜在的数据包丢失持续时间可能更长,例如可能约250ms。这些都会对大量订户造成影响,所以鼓励服务供应商增加可以最小化或消除这些保护机制造成的可见影响的机制。

考虑到其他保护机制所带来的潜在分组丢失持续时间可能更长,例如,一个完整的IP(IGP)路由表重收敛将带来约30s的潜在分组丢失脉冲。这样的事件已经不能算作是服务质量缺陷,而应该被认为是服务中断,一个IPTV系统也无法奢望在发生这样的事件时还能维持正常的服务。

所有的损失都被指定为端到端的目标(从视频源到机顶盒的视频输出到电视机,包括任何可能在网络或应用层应用的损失校正机制)

• 错误事件的损失距离应被限制在特定时间段内要求的损失事件数以下。一组IP数据包(每个数据包包含有7个MPEG传输流数据包)的丢失或损坏都被认为是错误事件。

• 机顶盒解码器应该采用错误隐藏技术来最小化丢失或损坏的视频数据包的影响。

• DSLF TR126的附录II-错误保护机制提供了有关于接入误码率,FEC和ARQ机制的额外细节。


我们的目标是,通过结合网络性能要求、损失恢复机制(例如FEC、梳妆滤波器)和损失缓解机制(例如解码器损失隐藏)来尽可能最小化可见损失。
 

关注公众号,掌握更多多媒体领域知识与资讯

文章帮到你了?可以扫描如下二维码进行打赏~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值