小艾笔记--H.264视频编解码原理整理（二）

最新推荐文章于 2022-12-09 16:53:55 发布

Mr_小艾

最新推荐文章于 2022-12-09 16:53:55 发布

阅读量1.3k

点赞数 1

分类专栏：小艾 H.264编码算法笔记文章标签： h.264 变换编码量化编码熵编码视频编解码原理

本文链接：https://blog.csdn.net/qq_26986211/article/details/52779139

版权

小艾 H.264编码算法笔记专栏收录该内容

5 篇文章 7 订阅

订阅专栏

本博客接着介绍H.264视频编解码的后续三个主要操作，今天一下子准备研究完成这些内容的，可一个上午卡在变化编码哪里了!也不是说编码算法多麻烦，因为我现在根本不去深入探究这些，只要了解有这样的算法就可以了。卡在了图像像素和图像信号之间的关系，查阅了许多资料大多说的模棱两可。。。经过我的不懈努力，算是理解了（虽然可能是错误的）。将自己的经验分享给大家

变换编码
量化
熵编码

变换编码

从频域的角度减小图像信号信号的空间相关性，不直接对空间域图像信号进行编码，是先将信号映射变换到另一个正交矢量空间（变换域/频域），产生一批变换系数，然后对系数进行处理。
今天上午看的时候，他和帧内和帧间编码的目的差不多，目的也是解决图片本身的空间冗余和图片与图片之间的时间冗余，得到压缩的编码效果。但他们的区别是什么呢？

变换编码与预测编码的区别

预测编码：主要就是通过预测减少数据在时间和空间上的相关性，根据某一模型利用过去的样值对当前样值进行预测，然后将当前的实际数值与预测值相减得到一个差值，只对这一预测误差值进行编码保存。除了基本保留了原始数据的I帧，压缩率极低。P帧更多的是记录了与前一帧（I帧或P帧）的不同之处，B帧则记录了与上一帧或者后一帧的不同，压缩率是最高的。解码的时候根据参考帧以及差别就可以基本在人眼察觉不到的情况下恢复图像帧；

变换编码通常用几何（空间域）描述图像信号一某种数学的运算变换到另一种正交矢量空间进行扫描，主要是讲低频、直流分量与高频、可被压缩分量分开，这里说到的低频、直流等一些可能刚开始接触是不理解的，毕竟在我们的意识里一帧图片的组成就是像素点。慢慢来介绍。不知道大家可还记得YUV的图像格式，我以前的博客介绍过，人眼对Y分量的敏感度要高于U和V分量。同样的人眼对低频、直流的分量的敏感度要高于高频、可被压缩的分量。（越敏感的话就不能实现太大的压缩处理，否则图像失真、模糊；相反，不敏感的分量就可以高压缩处理。说到这里，我想到了我昨天介绍预测编码的步骤的时候就出现过直流等，现在想想也许也好理解的多了，言归正传）就像刚才所说，设备采集的图像有YUV组成根据空间域的像素点是无法去区分直流、高频、低频的分布，那么就需要数学的方法进行转换，这个就是变换，把空间域转换成频域。让直流、高频、低频三足鼎立。一般左上角的代表直流和低频分量，右下角代表高频分量。当然你可以想象一下他们的势力大小，直流和低频占据一大半，高频只有较小的部分。。。为后续的量化，压缩编码创造条件。（以上就是我对变换编码的理解，可能是说的不对，希望大家有需要的看）。

变换编码的算法

了解了为什么以及什么是变换编码，下面简单介绍一下变换编码的算法。稍微了解的话，看到的最多的就是离散余弦变换编码（DCT）。这里我先简单我对算法的理解：输入一帧图片根据采样值大小获取图片中多少个像素信号，关键点在于对这些采集的像素信号点怎么组织分布。让属于一类的分量放在一个区域，形成最终的频域分布。当然，按我的思路采样值越大，采集的点越大，解码恢复的时候图像更加清晰。但带来一个后果就是处理的时候数据量太大。视频信号一般是一组图像帧信号组成。每帧画面需要切割成宏块，图像数据压缩处理的基本单元。宏块的选择也是关键。
直接把书中介绍的算法细节截图下来了，就不打字了！

量化

量化编码就是将DCT变换产生的系数除以一个常量，经过量化后的结果是量化步长的整数倍或为更多的零值，从而达到了压缩的目的。但取整是四舍五入，所以反量化的时候就无法完全恢复，所以是视频编码失真的关键所在
原理如下图所示：

量化原理

当然了，计算时一般不直接用除法，可以考虑移位等功能。

之字形扫面

变换使空域的图像信号重新分布。为了把左上方重要的非零值按照一维顺序串联起来，需要把变换后的系数按照一定的次序重新放置。采用“之”字形扫描方式就可以把图像块的这些非零值串接起来，从而把更多的零值丢弃。这样便于后续的熵编码
之字形扫描

熵编码

经过变换、量化后，图像数据已经经过了一定程度的压缩。作为混合视频编码的最后一个模块，我猜一定是统计了。图像的DCT量化系数相关性较小，所有系数均重要，但数据的概率分布有一定的规律。熵编码利用概率分布规律实现无损的统计编码。
原理：符号出现概率大的用短码字来表示，符号出现概率小的用长码字来表示，起到一定的压缩目的。所以又称可变长编码。熵编码是可逆编码，所以失真的情况来自变换、量化。如果变换可逆则只存在于量化。

好了，今天就到这里。完成了视频编解码的步骤，不过也只是一个理解。后面的路任重而道远。一步一步来。。。欢迎大家指出我的不足之处，我会积极采纳改进的，我是Mr.小艾。

Mr_小艾

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
小艾笔记--H.264视频编解码原理整理（二）

本博客接着介绍H.264视频编解码的后续三个主要操作，今天一下子准备研究完成这些内容的，可一个上午卡在变化编码哪里了!也不是说编码算法多麻烦，因为我现在根本不去深入探究这些，只要了解有这样的算法就可以了。卡在了图像像素和图像信号之间的关系，查阅了许多资料大多说的模棱两可。。。经过我的不懈努力，算是理解了（虽然可能是错误的）。将自己的经验分享给大家变换编码量化熵编码变换编码从频域的角度减小图像
复制链接

扫一扫