AVS2简单梳理

RDO

标签(空格分隔): 未分类


  • AVS2层次结构

    • 条带:按光栅扫描顺序连续排列的若干最大编码单元行
    • 最大编码单元(LCU):64x64
    • 编码单元(CU):64x64 32x32 16x16 8x8
    • 预测单元(PU)
    • 变换单元(TU):大小和形状由PU决定,<=PU
  • 帧内预测

    • LCU中深度优先遍历四叉树结构,从底层编码CU,逐层往上,率失真优化确定CU模式
    • 亮度预测(33种模式,DC模式、Plane模式、bilinear模式和30种角度预测模式,前三种使用概率大)和色度预测:(DC模式当前编码像素的上方块和左方块的平均值,Plane左邻和上邻的线性组合得到)…
    • 色度预测五种模式
    • SDIP(短距离帧内预测): PU非对称划分
    • RD7.0中首先计算出当前编码快所有预测模式的预测值,然后计算预测值和原始像素值的残差,计算哈达玛变换后的绝对值的和,选择代价值最小的9中模式进行率失真优化,选择最优测试模式
  • 帧间预测

    • I帧,P帧(单向预测、一个参考帧),B帧(双向预测),F帧(单向预测、两个参考帧)
  • 变换

    • 整数DCT变换(正交变换),时域映射到频域,能量更加集中
    • 4x4、8x8、16x16、32x32大小的TU直接进行整数DCT变换,64x64、64x16和16x64大小的TU先进行小波变换,在进行整数DCT变换
    • DCT变换完成后,对低频系数的4x4块进行二次4x4变换,能量进一步集中
  • 量化

    • 率失真量化技术(RDOQ),合理范围内适当的修改量化后的系数值。三个量化值候选项,ceil, floor, 0, 率失真选择最小代价最小的候选项
  • 熵编码

    • 量化后的系数进行熵编码之前进行Zigzag扫描,形成若干4x4大小的CG系数组
    • 变长编码和基于上下文自适应的二进制算术编码
  • 环路滤波


  • RDcost = Distortion + lamda * BitRate
  • RDO级
阅读更多
个人分类: AVS2
上一篇Cuda入门代码
下一篇xavs2 RDO
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭