FFmpeg 之I、B、P帧的基本编码原理，太完整了

最新推荐文章于 2024-07-29 23:56:00 发布

m0_60635245

最新推荐文章于 2024-07-29 23:56:00 发布

阅读量897

点赞数 8

分类专栏： 2024年程序员学习文章标签： ffmpeg 机器学习人工智能

本文链接：https://blog.csdn.net/m0_60635245/article/details/137094489

版权

给大家分享一份移动架构大纲，包含了移动架构师需要掌握的所有的技术体系，大家可以对比一下自己不足或者欠缺的地方有方向的去学习提升；移动架构师需要掌握的所有的技术体系，大家可以对比一下自己不足或者欠缺的地方有方向的去学习提升；**[外链图片转存中…(img-MkspGtsJ-1711558500969)]本文已被CODING开源项目：《Android学习笔记总结+移动架构视频+大厂面试真题+项目实战源码》收录。

摘要由CSDN通过智能技术生成

19956127-1d7961a60dae9221

I帧的压缩编码算法

从图中可以看到，如果图像是用RGB颜色空间表示的，则首先把它转换成用YCbCr空间表示的图像。然后每个图像平面分成8x8像素的图块，并对每个图块进行离散余弦变换（DCT）。

这里DCT的作用非常大，看它的名字可能会觉得非常高大上，其实它就是一个矩阵变换。关于它其实都可以专门写一篇文章出来，不过这里我们只需要知道它的作用即可。DCT简单点来说，它就是将前面8x8像素图块的颜色空间数据，分为高频数据和低频数据，所以我们也常说，DCT是把数据从空间域转换到频率域。

那什么是高频和低频呢？这里的高频数据是指，图像颜色的变化比较强烈的地方，比如人像画的轮廓与背景的交叉处，在这里的色值变化很快，所以称为高频。相对的低频就是指，颜色变化比较缓和的地方。所以DCT的作用并不是对数据进行压缩，而是为了方便后面的操作，比如量化、RLE行程编码、以及霍夫曼编码。

下一步就是量化，因为人眼对高频区域其实并不敏感，所以利用这一点，可以将高频部分数据进行压缩。这样一来，图块的数据就会呈现两部分，一部分是变化平滑的低频数据，另一部分是刚压缩过的高频部分，数值也变得差不多。而后再经过Zig-zig编排，数据就会呈现出连续几个值相同的的形式，比如23334551550000。这样一来，再经过RLE行程编码，就可以去掉连续值相同的冗余数据。

因为RLE在编码时，对相同的数值只编码一次，同时

最低0.47元/天解锁文章

m0_60635245

关注

8
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
FFmpeg 之I、B、P帧的基本编码原理，太完整了

给大家分享一份移动架构大纲，包含了移动架构师需要掌握的所有的技术体系，大家可以对比一下自己不足或者欠缺的地方有方向的去学习提升；移动架构师需要掌握的所有的技术体系，大家可以对比一下自己不足或者欠缺的地方有方向的去学习提升；**[外链图片转存中…(img-MkspGtsJ-1711558500969)]本文已被CODING开源项目：《Android学习笔记总结+移动架构视频+大厂面试真题+项目实战源码》收录。
复制链接

扫一扫

专栏目录