RDO
标签(空格分隔): 未分类
AVS2层次结构
- 条带:按
光栅扫描顺
序连续排列的若干最大编码单元行 - 最大编码单元(LCU):64x64
- 编码单元(CU):64x64 32x32 16x16 8x8
- 预测单元(PU)
- 变换单元(TU):大小和形状由PU决定,
<=
PU
- 条带:按
帧内预测
- LCU中深度优先遍历四叉树结构,从底层编码CU,逐层往上,率失真优化确定CU模式
- 亮度预测(33种模式,DC模式、Plane模式、bilinear模式和30种角度预测模式,前三种使用概率大)和色度预测:(DC模式当前编码像素的上方块和左方块的平均值,Plane左邻和上邻的线性组合得到)…
- 色度预测五种模式
- SDIP(短距离帧内预测): PU非对称划分
- RD7.0中首先计算出当前编码快所有预测模式的预测值,然后计算预测值和原始像素值的残差,计算哈达玛变换后的绝对值的和,选择代价值最小的9中模式进行率失真优化,选择最优测试模式
帧间预测
- I帧,P帧(单向预测、一个参考帧),B帧(双向预测),F帧(单向预测、两个参考帧)
变换
- 整数DCT变换(正交变换),时域映射到频域,能量更加集中
- 4x4、8x8、16x16、32x32大小的TU直接进行整数DCT变换,
64x64、64x16和16x64大小的TU先进行小波变换,在进行整数DCT变换
。 - DCT变换完成后,对
低频系数
的4x4块进行二次4x4变换
,能量进一步集中
量化
- 率失真量化技术(RDOQ),
合理范围内适当的修改量化后的系数值。三个量化值候选项,ceil, floor, 0, 率失真选择最小代价最小的候选项
- 率失真量化技术(RDOQ),
熵编码
- 量化后的系数进行熵编码之前进行
Zigzag扫描,形成若干4x4大小的CG系数组
- 变长编码和基于上下文自适应的二进制算术编码
- 量化后的系数进行熵编码之前进行
环路滤波
- RDcost = Distortion + lamda * BitRate
- RDO级