FFmpeg 之I、B、P帧的基本编码原理（三）

最新推荐文章于 2024-07-06 23:37:49 发布

2401_84132176

最新推荐文章于 2024-07-06 23:37:49 发布

阅读量941

点赞数 6

分类专栏：程序员文章标签： ffmpeg

本文链接：https://blog.csdn.net/2401_84132176/article/details/137533186

版权

程序员专栏收录该内容

176 篇文章 0 订阅

订阅专栏

那什么是高频和低频呢？这里的高频数据是指，图像颜色的变化比较强烈的地方，比如人像画的轮廓与背景的交叉处，在这里的色值变化很快，所以称为高频。相对的低频就是指，颜色变化比较缓和的地方。所以DCT的作用并不是对数据进行压缩，而是为了方便后面的操作，比如量化、RLE行程编码、以及霍夫曼编码。

下一步就是量化，因为人眼对高频区域其实并不敏感，所以利用这一点，可以将高频部分数据进行压缩。这样一来，图块的数据就会呈现两部分，一部分是变化平滑的低频数据，另一部分是刚压缩过的高频部分，数值也变得差不多。而后再经过Zig-zig编排，数据就会呈现出连续几个值相同的的形式，比如23334551550000。这样一来，再经过RLE行程编码，就可以去掉连续值相同的冗余数据。

因为RLE在编码时，对相同的数值只编码一次，同时计算相同数值重复的次数，因此称为行程编码。而与RLE处于同级的DPCM，则主要是对图块与图块之间的差值进行编码。这样一来可以再次压缩数据，之后再通过霍夫曼编码或者算术编码，编码操作也就完成了。同样霍夫曼编码和算术编码，也可以单独写一篇文章出来。

2、P帧的基本编码原理

===========

P帧也就是预测图像P，与I帧不同的是，它不仅要从空间上去除冗余数据，还要从时间冗余方面上着手，因为它是以在它之前出现的I帧作为参考对象来编码的。与I帧不同的是，预测图像P的编码是以16x16像素的宏块为基本编码单元的。对于P帧，为了表示它与前面I帧的关系，我们会一直用预测图像和参考图像这两个词。

其实很好想象，因为对预测图像编码，就是对它和参考图像直接的差值进行编码。所以我们只需要做到以下两点即可：

1、算出当前要编码的图像宏块，与参考图像宏块之间的差值
2、计算出宏块的移动矢量

比如下图：

19956127-e49542061efa8ea5

这张图应该一目了然，时刻1中的人像，在时刻2移动到了图像右侧。这个过程中变化的，不只是人像的位置，因为人在移动的时候，会有其他的动作，比如低头、转头、仰头等动作。所以我们并不仅仅要计算出人像变化之后的位置，也就是移动矢量，还要计算出两个宏块之间的差值。

当然这两者在编码过程中，是有个先后关系的。比如我要计算出宏块的移动矢量，那我得找到参考图像中的宏块，在预测图像中的位置吧。而更进一步，那我怎么找到预测图像相对于参考图像中，图块的位置呢？答案是预测图像中的某个宏块，与参考图像中的这个宏块的差值最小，也即最佳匹配宏块。

这就引起了一系列的搜索算法，去预测图像中去找这个宏块，比如二维对数搜索法、三步搜索法、对偶搜索法。而对预测图像P的编码所引起的时间，则主要是执行这个搜索算法所占用的时间。

等找到最佳匹配宏块后，计算出差值和移动矢量，剩下的操作就和对I帧的编码一致了。

19956127-9dfa96238d3af0ba

预测图像P的压缩编码算法

3、B帧的基本编码原理

===========

B帧也是双向预测图像B，对它的编码，即是对它前后帧的像素值之差进行编码，具体的方法和对预测图像P的算法类似。

19956127-aad24a39335e6bd0

双向预测图像B的压缩编码算法
自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数初中级Android工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则近万的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Android移动开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上Android开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且会持续更新！

如果你觉得这些内容对你有帮助，可以扫码获取！！（备注：Android）

最后看一下学习需要的所有知识点的思维导图。在刚刚那份学习笔记里包含了下面知识点所有内容！文章里已经展示了部分！如果你正愁这块不知道如何学习或者想提升学习这块知识的学习效率，那么这份学习笔记绝对是你的秘密武器！

《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取！

2401_84132176

关注

6
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
FFmpeg 之I、B、P帧的基本编码原理（三）

P帧也就是预测图像P，与I帧不同的是，它不仅要从空间上去除冗余数据，还要从时间冗余方面上着手，因为它是以在它之前出现的I帧作为参考对象来编码的。这里的高频数据是指，图像颜色的变化比较强烈的地方，比如人像画的轮廓与背景的交叉处，在这里的色值变化很快，所以称为高频。这个过程中变化的，不只是人像的位置，因为人在移动的时候，会有其他的动作，比如低头、转头、仰头等动作。B帧也是双向预测图像B，对它的编码，即是对它前后帧的像素值之差进行编码，具体的方法和对预测图像P的算法类似。预测图像P的压缩编码算法。
复制链接

扫一扫