学习笔记 | 新一代高效视频编码H.265/HEVC：原理标准与实现 | 第一章绪论

是小曾呀-

已于 2023-02-22 11:27:44 修改

阅读量1.1k

点赞数 1

分类专栏：视频处理原创 H.265 文章标签：学习音视频视频编解码

于 2022-07-16 14:51:12 首次发布

本文链接：https://blog.csdn.net/weixin_43386711/article/details/125575984

版权

原创同时被 3 个专栏收录

16 篇文章 1 订阅

订阅专栏

视频处理

1 篇文章 0 订阅

订阅专栏

H.265

1 篇文章 0 订阅

订阅专栏

系列文章目录

学习笔记 | 新一代高效视频编码H.265/HEVC：原理标准与实现 | 第一章绪论

前言

浅浅记录下学习H.265/HEVC的一些知识点和自己的理解

一、视频编码是什么？

视频编码（Video Coding），也称为视频压缩，其目的是尽可能去除数据中的冗余部分，减少表征视频的数据量。

1.视频

视频中完整图像通常被称为帧（Frame），由许多帧按照时间顺序组成的视频也被称为视频序列（Video Sequence）。每秒播放的帧数目叫做帧率（Frame Rate），单位为fps。为了使人眼能够有平滑的体验，视频的帧率需要达到25~30fps以上。

2.视频压缩

数据压缩通常分为无损压缩和有损压缩两大类。

（1）无损压缩

无损压缩是指数据经过压缩后，所携带的信息并没有损失，通过重建可以完全恢复原来的数据。无损压缩适用于数据需要严格完全重建的情形，常用于对文本文件、程序文件等进行压缩。
受信息熵的限制，无损压缩的压缩率普遍不高，通常在5：1以下，对于图像的无损压缩而言，压缩率以3：1最为常见。

（2）有损压缩

有损压缩以引入一定失真为代价，换取更高的压缩比。能够应用有损压缩的条件是人们对于引入的失真能够接受。有损压缩的典型应用就是用于人类认知的音频、图像和视频。
为了获得较高的压缩率，视频通常采用有损压缩，即以损失一定质量的代价获取高压缩比。此时衡量压缩算法的两个参数是码率和失真。有损压缩追求的是，在质量损失一定下获得最高的压缩比（最低的码率）；或者在码率一定的条件下，视频质量最好。

二、视频编码标准

1.什么是视频编码标准

视频编码标准只是规定了编码码流的语法语义和解码器，只要求视频编码后的码流符合标准的语法结构，解码器就可以根据码流的语法语义进行正常解码。
在编码器输出的码流中，数据的基本单位是语法元素，每个语法元素由若干比特组成，它表征某个特定的物理意义，如预测类型、量化参数等。

（1）H.26X系列标准

H.261标准是1990年ITU-T制定的一个数字视频编码标准，其设计的目的是能够在带宽为64kbit/s的倍数的综合业务数字网上传输质量可接受的视频信号。此时H.261主要针对的应用是基于ISDN的视频通信，如可视电话、视频会议等。
由于世界各国采用的电视制式不同，主要有PAL（Phase Alternating Line）和NTSC（National Television System Committee）两大类，要在这些国家之间建立可视电话或视频会议业务，是不能直接使用电视信号进行传输的。为此，H.261提出了通用中间格式的视频（Common Intermediate Format， CIF）来解决。另外，H.261也可处理QCIF的视频，主要面对的是更低带宽下视频传输的应用。
H.261标准主要采用的编码方式包括基于运动补偿的帧间预测、离散余弦变换（Discrete Cosine Transform）、量化、zig-zag扫描和熵编码等。
H.263最初是针对低码率的视频会议应用而设计。后期证明，H.263视频编码并不局限于低码率传输环境，而适用于很大的动态码率范围。
H.263标准仍然以混合编码框架为核心，其基本原理、原始数据和码流组织都与H.261十分相似。在H.263的发展中，出现了两个具有增强功能的改进版本，分别是H.263+标准和H.263++标准。H.263+允许更多的图像输入格式，扩宽了视频编码的范围；采用了帧内预测及去块效应滤波，提高了压缩效率；增加了时间分级、信噪比和空间分级，提高了视频信号传输的有效性，增强了视频传输的抗误码能力。
H.263++在H.263+的基础上增加了附加选项（Annex）U（增强型参考帧选择）、V（数据分片）和W（补充信息）来提高码流的抗出错性能（Error Resilience），这些措施同时也提高了编码效率。
H.264/AVC标准仍然沿用了混合编码的理念，在此框架下支持了许多先进的编码技术，例如，具有方向性的帧内预测、多参考帧运动补偿、灵活分块的运动补偿、可用于预测的B帧、4X4及8X8整数DCT变换、环路去方块滤波和自适应熵编码等。H.264/AVC标准还提供了一系列增强视频编码鲁棒性的方式，例如数据分割、灵活宏块顺序等。这些编码方式均在H.264/AVC标准中的视频编码层（Video Coding Layer，NAL），通过NAL单元，将H.264/AVC VCL的码流数据与下层传输协议有机结合。
H.264具有非常好的网络适配性和抗出错能力，因此非常适合用于各类交互式网络视频应用。H.264/AVC的优秀压缩性能也保证了它在视频存储、广播和流媒体等领域的广泛应用。

（2）MPEG系列标准

MPEG-1标准是MPEG制定的第一个视频和音频有损压缩标准，也是最早推出及应用在市场上的MPEG技术，主要目标是针对数字存储媒体，记录活动图像及其伴音的编码方式。由于编码能力的限制，MPEG-1标准对运动较大视频信号进行编码会产生“马赛克”现象，因此适用于运动适中或较慢的视频内容，曾应用于卡拉OK、VCD影音光碟以及视频点播等多种音像系统。
MPEG-2标准是继MPEG-1标准之后由MPEG标准推出的音视频编码标准。应用范围包括卫星电视、有线电视等，经少量修改后，也成为广为人知的DVD产品的核心技术。MPEG-2视频编码中开始引入了档次（Profile）和等级（Level）能够针对不同应用要求进行编码模式选择。
MPEG-4的不同部分分别定义了系统、音视频编码、多媒体传输集成框架、知识产权管理、动画框架扩展和3D图形压缩等内容。

（3）H.265/HEVC

类似于以往的国际标准，H.265/HEVC仍旧采用混合编码框架，包括变换、量化、熵编码、帧内预测、帧间预测以及环路滤波等模块。相比于以往的视频编码标准，H.265/HEVC的编码性能有了很大提高，这源于新编码工具的使用以及自身具有的核心技术。H.265/HEVC中新的编码技术有很多，例如基于四叉树的灵活分割结构、不同角度的帧内预测模式、自适应的运动矢量预测AMVP、合并技术Merge、可变尺寸的离散余弦变换、模式依赖的离散正弦变换、性能更好的CABAC，以及新的样点自适应补偿滤波器等。