系列文章目录
学习笔记 | 新一代高效视频编码H.265/HEVC:原理标准与实现 | 第一章绪论
文章目录
前言
浅浅记录下学习H.265/HEVC的一些知识点和自己的理解
一、视频编码是什么?
视频编码(Video Coding),也称为视频压缩,其目的是尽可能去除数据中的冗余部分,减少表征视频的数据量。
1.视频
视频中完整图像通常被称为帧(Frame),由许多帧按照时间顺序组成的视频也被称为视频序列(Video Sequence)。每秒播放的帧数目叫做帧率(Frame Rate),单位为fps。为了使人眼能够有平滑的体验,视频的帧率需要达到25~30fps以上。
2.视频压缩
数据压缩通常分为无损压缩和有损压缩两大类。
(1)无损压缩
无损压缩是指数据经过压缩后,所携带的信息并没有损失,通过重建可以完全恢复原来的数据。无损压缩适用于数据需要严格完全重建的情形,常用于对文本文件、程序文件等进行压缩。
受信息熵的限制,无损压缩的压缩率普遍不高,通常在5:1以下,对于图像的无损压缩而言,压缩率以3:1最为常见。
(2)有损压缩
有损压缩以引入一定失真为代价,换取更高的压缩比。能够应用有损压缩的条件是人们对于引入的失真能够接受。有损压缩的典型应用就是用于人类认知的音频、图像和视频。
为了获得较高的压缩率,视频通常采用有损压缩,即以损失一定质量的代价获取高压缩比。此时衡量压缩算法的两个参数是码率和失真。有损压缩追求的是,在质量损失一定下获得最高的压缩比(最低的码率);或者在码率一定的条件下,视频质量最好。
二、视频编码标准
1.什么是视频编码标准
视频编码标准只是规定了编码码流的语法语义和解码器,只要求视频编码后的码流符合标准的语法结构,解码器就可以根据码流的语法语义进行正常解码。
在编码器输出的码流中,数据的基本单位是语法元素,每个语法元素由若干比特组成,它表征某个特定的物理意义,如预测类型、量化参数等。
(1)H.26X系列标准
- H.261标准是1990年ITU-T制定的一个数字视频编码标准,其设计的目的是能够在带宽为64kbit/s的倍数的综合业务数字网上传输质量可接受的视频信号。此时H.261主要针对的应用是基于ISDN的视频通信,如可视电话、视频会议等。
由于世界各国采用的电视制式不同,主要有PAL(Phase Alternating Line)和NTSC(National Television System Committee)两大类,要在这些国家之间建立可视电话或视频会议业务,是不能直接使用电视信号进行传输的。为此,H.261提出了通用中间格式的视频(Common Intermediate Format, CIF)来解决。另外,H.261也可处理QCIF的视频,主要面对的是更低带宽下视频传输的应用。
H.261标准主要采用的编码方式包括基于运动补偿的帧间预测、离散余弦变换(Discrete Cosine Transform)、量化、zig-zag扫描和熵编码等。 - H.263最初是针对低码率的视频会议应用而设计。后期证明,H.263视频编码并不局限于低码率传输环境,而适用于很大的动态码率范围。
H.263标准仍然以混合编码框架为核心,其基本原理、原始数据和码流组织都与H.261十分相似。在H.263的发展中,出现了两个具有增强功能的改进版本,分别是H.263+标准和H.263++标准。H.263+允许更多的图像输入格式,扩宽了视频编码的范围;采用了帧内预测及去块效应滤波,提高了压缩效率;增加了时间分级、信噪比和空间分级,提高了视频信号传输的有效性,增强了视频传输的抗误码能力。
H.263++在H.263+的基础上增加了附加选项(Annex)U(增强型参考帧选择)、V(数据分片)和W(补充信息)来提高码流的抗出错性能(Error Resilience),这些措施同时也提高了编码效率。 - H.264/AVC标准仍然沿用了混合编码的理念,在此框架下支持了许多先进的编码技术,例如,具有方向性的帧内预测、多参考帧运动补偿、灵活分块的运动补偿、可用于预测的B帧、4X4及8X8整数DCT变换、环路去方块滤波和自适应熵编码等。H.264/AVC标准还提供了一系列增强视频编码鲁棒性的方式,例如数据分割、灵活宏块顺序等。这些编码方式均在H.264/AVC标准中的视频编码层(Video Coding Layer,NAL),通过NAL单元,将H.264/AVC VCL的码流数据与下层传输协议有机结合。
H.264具有非常好的网络适配性和抗出错能力,因此非常适合用于各类交互式网络视频应用。H.264/AVC的优秀压缩性能也保证了它在视频存储、广播和流媒体等领域的广泛应用。
(2)MPEG系列标准
- MPEG-1标准是MPEG制定的第一个视频和音频有损压缩标准,也是最早推出及应用在市场上的MPEG技术,主要目标是针对数字存储媒体,记录活动图像及其伴音的编码方式。由于编码能力的限制,MPEG-1标准对运动较大视频信号进行编码会产生“马赛克”现象,因此适用于运动适中或较慢的视频内容,曾应用于卡拉OK、VCD影音光碟以及视频点播等多种音像系统。
- MPEG-2标准是继MPEG-1标准之后由MPEG标准推出的音视频编码标准。应用范围包括卫星电视、有线电视等,经少量修改后,也成为广为人知的DVD产品的核心技术。MPEG-2视频编码中开始引入了档次(Profile)和等级(Level)能够针对不同应用要求进行编码模式选择。
- MPEG-4的不同部分分别定义了系统、音视频编码、多媒体传输集成框架、知识产权管理、动画框架扩展和3D图形压缩等内容。
(3)H.265/HEVC
类似于以往的国际标准,H.265/HEVC仍旧采用混合编码框架,包括变换、量化、熵编码、帧内预测、帧间预测以及环路滤波等模块。相比于以往的视频编码标准,H.265/HEVC的编码性能有了很大提高,这源于新编码工具的使用以及自身具有的核心技术。H.265/HEVC中新的编码技术有很多,例如基于四叉树的灵活分割结构、不同角度的帧内预测模式、自适应的运动矢量预测AMVP、合并技术Merge、可变尺寸的离散余弦变换、模式依赖的离散正弦变换、性能更好的CABAC,以及新的样点自适应补偿滤波器等。
总结
通过这一章的学习大概了解了视频编码发展的大致过程,对编码涉及的技术也是有所了解,为之后学习奠定基础。