h264编码算法由浅入深（一）

最新推荐文章于 2024-01-25 11:02:47 发布

fantasy_arch

最新推荐文章于 2024-01-25 11:02:47 发布

阅读量1.8k

点赞数 3

分类专栏：音视频文章标签： h264

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fantasy_ARM9/article/details/78762770

版权

音视频专栏收录该内容

124 篇文章 14 订阅

订阅专栏

h264压缩的主要过程。

宏块划分－》帧内／帧间运动检测－》dct变换，量化－》环路滤波－》熵编码－》封装数据写slice

h264数据帧

编码器每次输出一个slice，一帧数据可能分为多个slice，也可能一个。大多数情况是一个slice。

slice类型即nalu类型的定义如下：

0：未规定
    1：非IDR图像中不采用数据划分的片段
    2：非IDR图像中A类数据划分片段
    3：非IDR图像中B类数据划分片段
    4：非IDR图像中C类数据划分片段
    5：IDR图像的片段
    6：补充增强信息 (SEI)
    7：序列参数集
    8：图像参数集
    9：分割符
    10：序列结束符
    11：流结束符
    12：填充数据
    13 – 23：保留
    24 – 31：未规定

1 h264数据帧中，只有I帧是关键帧，是被参考的帧。其它如P帧和B帧都是参照其它帧。（参考关系主要体现在宏块运动向量和残差数据计算）

P帧永远参考前面的帧，可能会参考很多帧，这个由预设值lookahead决定，B帧可能会前后参考。I帧只会有帧内宏块间的参考。

2 有的视频没有B帧，因为profile类型是baseline，一般硬件编码都是实现的这种profile类型，如海思芯片，一些手机硬件编码等等。profile类型在sps slice中，位于nalu类型子节后面一个字节。

3 编码中又个关键指标步长是什么？

视频数据信号经过宏块运动估计，得到残茶数据之后，进行DCT变换，得到连续的余弦函数信号，通过一定的采样频率进行采样，

这个采样周期就是步长的幅度差值。

4 宏块运动估计算法是怎样的？

宏块初始化后悔被分为16x16 ，16x8，8x16 8x8 的宏块，并且是将亮度y和色差信号uv分开的。帧内运动估计，主要是左，右，右上，左上四个方向预测。

5 什么是半像素内插

宏块左运动估计的时候，会有只运动了半个像素的情况，这种情况下，通过在像素之间插入估计的像素值来计算宏块运动向量更精确。

6 sad和satd

sad是把整个宏块像素拿来计算残差，satd是先把宏块分为4x4的小块，进行哈德曼变幻，然后把变幻后的亚像素涌来计算残差和运动向量。

以上介绍了h264压缩的基本流程和一些常见的疑问。

备注：h264压缩的大部分耗时都是在宏块左运动估计的时候，模式选择和运动向量计算上。

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
h264编码算法由浅入深（一）

h264压缩的主要过程。宏块划分－》帧内／帧间运动检测－》dct变换，量化－》环路滤波－》熵编码－》封装数据写sliceh264数据帧编码器每次输出一个slice，一帧数据可能分为多个slice，也可能一个。大多数情况是一个slice。slice类型即nalu类型的定义如下： 0：未规定 1：非IDR图像中不采用数据划分的片段 2：非IDR图像中A类数据划分片段 3：非ID...
复制链接

扫一扫

专栏目录

fantasy_arch CSDN认证博客专家 CSDN认证企业博客

码龄12年

355: 原创

7716: 周排名

5213: 总排名

32万+: 访问

: 等级

6058: 积分

935: 粉丝

513: 获赞

104: 评论

735: 收藏

私信

关注

热门文章

分类专栏

x265 41篇
汇编 28篇
x264 34篇
ffmpeg 15篇
寄存器 3篇
bbr 1篇
笔记 1篇
grpc 1篇
fec 1篇
矩阵 1篇
p2p 1篇
nat 1篇
模板 2篇
音视频 124篇
内核 6篇
音视频 tcp 15篇
算法 41篇
C++ 汇编 24篇
ng
nginx 2篇
nginx 网络编程 2篇
C++ 25篇
C++语法 14篇
C++ lambda 1篇
右值引用 2篇
图像处理 3篇
高斯 1篇
双边 1篇
数据结构 2篇
libevent 2篇

最新评论

x264 源码 mv_range me_range与cost_mv 缓存
fantasy_arch: logs是一个经验数组，用来换算mv向量的cost，0.5 看着应该是模式字的cost 经验值。
x264 源码 mv_range me_range与cost_mv 缓存
水笙赵: 你好问一下 lambda * logs[i] + .5f ，其中 logs[i] 和 .5f是怎么来的？
网络文件系统
ha_lydms: 这篇博客真是我心灵的驿站，每次阅读都能够让我感到内心平静和宁静。
Hevc 的档次和层级
2301_76343466: Main422和Main444有没有资料
如何把对象new到共享内存上重启并恢复？
fantasy_arch: 进程空间是相互独立的，肯定不能的。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。