H.265/HEVC简介

2010年1月,由VCEG和MPEG组建的视频编码联合组(Joint Collaborative Team on Video Coding,JCT-VC)成立,负责组织新一代视频编码标准的研发和制定,并正式开始征集提案。
2010年4月在德国德累斯顿召开了JCT-VC第一次会议,确定新一代视频编码标准名称为HEVC(High Efficiency Video Coding),成立了AD HOC小组,分领域收集和审阅技术提案。JCT-VC确定HEVC的核心目标是在H.264/AVC High Profile 的基础上,将压缩效率提高一倍。即在保证相同视频图像质量的前提下,视频流的码流减少50%。在提高压缩效率的同时,允许编码端适当提高复杂度。
2010年6月在瑞士日内瓦召开了JCT-VC第二次会议,进一步对第一次会议中提出的编码工具进行测试和评估,并制定下次会议之前开展的测试计划。
2010年10月的JCT-VC第三次会议公布了第一份HEVC工作草案说明,并在会后发布了正式的测试模型HM(HEVC Model)。测试模型第一版HM1.0于2011年1月14日正式发布。
在随后的第四次至第七次会议上,JCT-VC不断地对新的编码工具和算法进行研究和改进,并发布了HEVC第二版至第五版工作草案及测试软件HM2.0、HM3.0、HM4.0、HM5.0。
2012年2月的第八次会议上,JCT-VC发布了具有里程碑意义的HEVC特别委员会草案(HEVC Specification Committee Draft),标志着VCEG和MPEG两大组织在合作开发新一代高性能视频编码标准的工作中取得了里程碑式的进展。随后在会议后发布了测试模型的第六个版本HM6.0,用于后续HEVC特别草案的进一步完善。
2012年5月25日,JCT-VC宣布在10月进行HEVC可分级视频编码(SVC)的性能评估。意味着HEVC将支持SVC。6月26日,MPEG LA宣布将进行HEVC专利的联合注册。
2012年7月,以第八次工作组草案说明的HEVC国际标准草案获得通过。
2013年1月25日,ITU-T宣布HEVC初步获得批准,同一天MPEG宣布HEVC被提交至国际标准最终草案状态。
2013年4月13日 H.265/HEVC被ITU-T正式接受为国际标准,并于2013年4月18日在其网站上预发布。
2013年6月7日,ITU-T网站上正式发布了H.265/HEVC标准,该标准可以免费下载。2013年11月25日,ISO/IEC正式发布了H.265/HEVC标准。
标准发布之后,相关标准的进一步工作仍然在继续。JCT-VC现有的工作主要集中在就H.265/HEVC的扩展内容进行完善,如更高的比特深度、4:2:2、4:4:4色度采样视频、可伸缩HEVC编码和多视角立体编码等。
从根本上说,H.265/HEVC视频编码标准的编码框架并没有革命性的改变。类似于以往的国际标准,H.265/HEVC仍旧采用混合编码框架,包括变换、量化、熵编码、帧内预测以及环路滤波等模块。但是,H.265/HEVC几乎在每个模块都引入了新的编码技术。
1 帧内预测
该模块主要用于去除图像的空间相关性。通过编码后的重构块信息来预测当前像素块以去除空间冗余信息,提高图像的压缩效率。与以往的标准相比,H.265/HEVC支持更多的帧内预测模式。
2 帧间预测
该模块主要用于去除图像的时间相关性。帧间预测通过将已编码的图像作为当前帧的参考图像,来获取各个块的运动信息,从而去除时间冗余,提高压缩效率。在H.265/HEVC中,帧间预测可采用单向和双向的参考图像来进行预测,包括类似H.265/AVC中分层B帧的预测结构。
3 变换量化
该模块通过对残差数据进行变换量化以去除频域相关性,对数据进行有损压缩。变换编码将图像从时域信号变换至频域,将能量集中至低频区域。量化模块可以减小图像编码的动态范围。变换编码和量化模块从原理上属于两个相互独立的过程,但是在H.265/HEVC中,两个过程相互结合,减少了计算复杂度。
4 去方块滤波
在基于块的视频编码中,形成的重构图像会出现方块效应,采用去方块滤波可达到削弱甚至消除方块效应的目的,提高图像的主观质量和压缩效率。H.265/HEVC仍然是基于块的视频编码,因此延续了环内去方块滤波的思路。
5 样点自适应补偿
样点自适应滤波处于去方块滤波之后,通过解析去方块滤波后的像素的统计特性,为像素添加相应的偏移值,可以在一定程度上削弱振铃效应,提高图像的主观质量和压缩效率。这是H.265/HEVC新增的一项编码方式。
6 熵编码
该模块将编码控制数据、量化变换系数、帧内预测数据以及运动数据等编码为二进制流进行存储或传输。熵编码模块的输出数据即原始视频压缩后的码流。H.265/HEVC中采用先进的基于上下文的自适应二进制算数编码进行熵编码,引入了并行处理架构,在速度、压缩率和内存占用方面均得到大幅改善。
相比于以往的视频编码标准,H.265/HEVC的编码性能有了很大的提升,这源于新编码工具的使用以及自身具有特色的核心技术。H.265/HEVC中新的编码技术有很多,例如基于四叉树的灵活块分割结构、不同角度的帧内预测模型、自适应的运动矢量预测AMVP、合并技术Merge、可变尺寸的离散余弦变换、模式依赖的离散正弦变换、性能更好的CABAC,以及新的样点自适应补偿滤波器等。
1 编码单元
H.265/HEVC标准中的核心编码单元是宏块,包含一个16 × 16的亮度块采样,对于一般的视频信源(如YUV4:2:0)而言,会伴随两个8 × 8 的色度块采样。由于高分辨率视频业务的自身特性,基于传统宏块的编码方式具有很大的局限性。因此,H.265/HEVC采用了编码树单元(Coding Tree Unit, CTU)和编码树块(Coding Tree Block, CTB)。H.265/HEVC 中CTU的概念类似于传统的宏块,但它的大小是可以由编码器设定的,并且可以超越16 × 16。一个CTU由一个亮度CTB、两个色度CTB和一些关联的语法元素组成。
为更灵活有效地表示视频内容,H.265/HEVC为图像的划分定义了一套全新的分割模式,包括编码单元(Coding Unit, CUT)、预测单元 (Prediction Unit,PU)和变换单元(Transform Unit,TU)。这种特性有助于编码器根据视频内容特性、视频应用和终端的特性来自适应地选择编码模式。
CTU中的四叉树确定了亮度和色度CB的大小和位置,四叉树的根节点与CTU关联。亮度CB最大可以支持到亮度CTB的大小。把CTU 划分成亮度CB和色度CB的过程是一体的。一个亮度CB、两个色度CB 和关联的语法元素构成一个CU。一个CTB可以只包含一个CU,也可以包含几个CU,每一个CU都有一个分区关联的PU和一个TU。
预测单元PU是帧内预测、帧间预测的基本单元,PU的划分包括4 种对称结构:2N×2N, 2N×N, N×2N以及N×N。另外,还有4种非对称结构:2N×nU,2N×nD,nL×2N以及nR×2N。
变换单元TU可采用4 × 4、32 × 32大小的离散余弦变换,此外还支持 4 ×4的离散正弦变换。大尺寸离散余弦变换是H.265/HEVC视频编码标准中提升编码效率的重要技术之一,在H.264/AVC中仅采用了4 ×4/8 × 8的 DCT变换,而在H.265/HEVC标准中DCT变换的最大尺寸为32 × 32,这种大尺寸变换单元的选择可以使编码器在处理高分辨率画面中经常出现平坦区域时能够更好地提高压缩率。
2 改进的帧内预测技术
在H.264/AVC中,基于 4×4大小的编码块采用9种预测模式,基于 16×16大小的编码块采用4种预测模式。考虑高清视频纹理的多样性,只采用H.264/AVC中提供的几种帧内预测模式是远远不够的。为了更准确地反映纹理特性,降低预测误差,H.265/HEVC提出了更为精确的帧内预测技术。对于亮度信号,H.265/HEVC共提供了35种帧内预测模式,包括33种角度预测以及DC预测模式和Planar预测模式。增加的预测模式可以更好地匹配视频中复杂的纹理,得到更好的预测效果,更加有效地去除空间冗余。
3 先进的帧间预测技术
为了提升帧间预测性能,在H.265/HEVC中引入了新的帧间预测技术,包括运动信息融合技术(Merge)、先进的运动矢量预测技术(Advanced Motion Vector Predictor, AMVP)以及基于Merge的Skip模式。Merge 技术利用空域相关性和时域相关性来减少相邻块之间的运动参数冗余,具体来说,就是取其相邻PU的运动参数作为当前PU的运动参数。 AMVP技术的作用与Merge技术类似,也是利用空域相关性和时域相关性来减少运动参数的冗余。AMVP技术得到的运动矢量一方面为运动估计提供搜索起点,另一方面作为预测运动矢量使用。
4 RQT技术
RQT(Residual Quad-tree Transform)技术是一种基于四叉树结构的自适应变换技术,它为最后TU模式选择提供了很高的灵活性。大块的TU模式能够将能量更好地集中,小块的TU模式能够保存更多的图像细节。根据当前CU内残差特性,自适应选择变换块大小,可以在能量集中和细节保留两者做最优的折中。与传统的固定块大小变换相比,RQT对编码效率贡献更大。
5 ACS技术
ACS (Adaptive Coefficient Scanning)包括三类:对角扫描、水平扫描和垂直扫描。 ACS技术是基于4×4块单元进行的,将一个TU划分为多个4×4块单元,每个4×4块单元内部以及各个4 ×4块单元之间都按照相同的扫描顺序进行扫描。对于帧内预测区域的4×4和8×8尺寸的TU,其根据所采用的帧内预测方向来选择扫描方法:当预测方向接近水平方向时就选用垂直扫描,当预测方向接近垂直方向时就选用水平扫描,对于其他预测方向使用对角扫描。对于帧间预测区域,无论TU尺寸多大都使用对角扫描方式。
6 SAO技术
图像经过编码后,重构图像的失真不仅存在方块效应,还存在振铃效应。H.265/HEVC引入了一种新的滤波方法:像素自适应补偿技术 (SAO)。SAO位于去块效率滤波器之后,用于补偿重构像素值,达到减少振铃效应失真目的。SAO分为边缘补偿(EO)和带状补偿(BO)两种方式。
7 IBDI技术
IBDI(Internal Bit Depth Increase)技术是指在编码器的输入端将未压缩图像像素深度由P比特增加到Q比特(Q>P),在解码器的输出端又将解压缩图像像素深度从Q比特恢复到P比特。IBDI技术提高了编码器的编码精度,降低了帧内/帧间预测误差。但由于要建立参考队列,像素深度为Q比特的重构图像须占较大的内存空间。此外,在进行帧间运动估计和补偿时,需要较多的内存访问带宽,这样会给内存受限的系统带来不便。解决的办法是引入参考帧压缩算法,来减小重构图像的数据量。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

水笙赵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值