MPEG-2标准解析-CSDN博客

MPEG-2听名称，就比MPEG-1牛逼了很多。

MPEG-2是MPEG专家组，从1990年就开始研究，并于94年完成的第二个视音频编码标准。相比于MPEG-1而言，它不仅继承了MPEG-1，而且在它的基础上，扩展了许多MPEG-1没有的功能，比如支持高分辨率的视像、大范围的数据速率、多声道的环绕声、多种视像分辨率、位速率不变、隔行扫描。

可以看到，新增的这几个功能，大致是在三个方面来提高：1、视音频的质量 2、视音频的传输 3、数字电视的支持

而且MPEG-2在这几个方面的提高，并非徒有虚名，就像MPEG-1在mp3以及VCD的应用一样，MPEG-2在DVD影视，和广播级质量的数字电视上，应用广泛，比如美国的ATSC DTV、欧洲的DVB和日本的ISDB。

不仅如此，为了达到广播级质量这一级别，也就是视像的实时传输，MPEG-2还制定了两种数据流格式，如PS流和TS流，其中MPEG2-TS流也即至今仍很常见的TS格式传输流，所以MPEG-2也成为了在因特网上传输数字电视的一种标准。

下面我们就开始一一来看，为了更好的了解，我们还是先看一下MPEG-2内容的组成部分，它总共由11各部分组成，不过对于我们来说，前三个部分就足够了：

在这里插入图片描述
MPEG-2标准的组成部分

表中前面的13818，是指ISO/IEC 13818，它是MPEG-2的标准编号。而在系统模型方面，与MPEG-1一样，它也由编码系统和解码系统两大部分组成。因为编码和解码只是相反的两个步骤，所以我们来着重看一下编码部分。

1、MPEG-2编码系统

MPEG-2的编码系统，由两部分组成：

（1）视像编码和声音编码
（2）数据打包和多路数据复合

第一部分肯定是必须的，而第二部分就是MPEG-2的特点。

在这里插入图片描述
MPEG-2编码系统

通过上图可以看到，图中虚线左边是视音频编码部分，而第二部分就是数据打包的部分。在数据打包的时候，MPEG-2将视像数据、声音数据和其他数据组合在一起，生成适合存储或传输的基本数据流，而我们使用的存储和传输两个词，也就是数据流的两种类型：

（1）PS流（Program Stream，节目数据流），由一个或多个打包的基本数据流（PES）组合生成的数据流，用在如DVD存储系统中。
（2）TS流（Transport Stream，数据传输流），同样也有一个或多个PES组合生成的数据流，用于数字电视广播或因特网传输等传输系统。

看到这里我们可能就会产生疑问，PS流和TS流看着也没什么区别呀，为啥应用不同呢？实际上，虽然他们都是对PES流的重新封装，但是它们的包结构是不同的。

PS流的包结构是可变长度的，而TS流的包结构是固定长度的。这就造成了它们的抗干扰性能的不同，比如PS流如果在传输信道上丢失掉某一同步信息，那么接收端就会无法同步，造成严重的信息丢失，所以PS流没有应用在传输领域。

而与之相对的，TS是固定长度的包结构，即使丢失某一个包，通过后面包的同步信息，也能恢复同步。这也就是MPEG2-TS流格式比较有名的，可以从视频流的任一片段独立解码。所以它使用在传输系统上，无可厚非。

当然了，这篇文章的主角是MPEG-2，并不是TS和PS，关于它们还有更多的内容，后面再单独开一篇介绍。

2、MPEG-2的视像编码器

看完了编码系统的视音频编码器和数据包装，下面我们来看一下它的视像编码器部分，也即视频图像的编码。

在MPEG-1中，我们知道它是从空间冗余和时间冗余方面，来去除冗余数据。而在MPEG-2中，在去除时间冗余数据方面，又有了新的提高。因为去除时间冗余数据的主要目标，为B帧和P帧，而编码这两种帧数据的主要工作，就是找到最佳匹配宏块（上篇讲过）。而跟找最佳匹配宏块相关的，就是下面的两个重要概念：

（1）移动估算（ME）：这个其实就是计算移动矢量的过程，移动矢量的计算精度越高，参考图像宏块，与预测图像宏块之间的差值就越小。
（2）运动补偿（MC，也为移动补偿）：计算当前编码宏块与参考图像宏块之间，像素值之差的过程。之所以叫补偿这个词，是因为在编码时使用的移动矢量和像素值差，在重构当前帧图块时，其实是相当于补偿量来处理的。

与MPEG-1不同的时，这次我们不再分别来看I、B、P帧的编码原理，因为这在MPEG-1里已经定义了。而在MPEG-2里，我们就来看看视像编码器的结构图，这在原理上与MPEG-1的结构基本一致：

在这里插入图片描述
MPEG-2视像编码器

图中：
Q为量化，IQ（Inverse quantization）为逆量化，DCT为离散余弦变换，IDCT为逆离散余弦变换，MCP（motion compensated predictor）为移动补偿预测器，ME为移动估算器，VLE为可变长度编码器，VLD（cariable length decoder）为可变长度解码器，FS（frame memory）为帧存储器

所以看了图，别说哪个词不认识哈。其中DCT、量化、VLE是我们在上篇介绍过的，而这幅结构图，只是把I、B、P帧的编码放到了一起。所以只要在图中，分别找到I、B、P帧的编码路线，即可看懂上图。

比如最上面那条线，从视像输入到DCT、Q、VLE不就是I帧的编码嘛。

而I帧同时也可以作为B帧和P帧的参考图像，所以在经过DCT、Q量化后，在量化DCT系数那一步，进入到内置解码器，如下图：

在这里插入图片描述
内置解码器输入输出