一、H265编码框架
1)帧内预测:利用当前图像已编码像素生成预测像素值,主要去除空间冗余信息。
35种预测模式:33种帧内预测模式+DC预测模式+planar预测模式
2)帧间预测:利用当前图像已经编码图像重建像素生成预测值,主要去除时间冗余信息。
ME:运动估计,提取当前图像的运动信息,为当前图像的每个像素块在之前已经编码的图像中寻找最佳的匹配块。
MC:运动补偿,
Merge:运动信息融合,利用相关性减少运动参冗余。取相邻的运动参量作为当前的运动参量。
AMVP:运动矢量预测,为运动估计提供搜索起点,作为运动矢量使用。
3)变换单元:DST/DCT:对残差数据利用正弦、余弦函数的矩阵对数据进行压缩。减少图像动态范围。
RQT:残差四叉树变换,基于四叉树自适应变换,根据CTU单元划分的CTB,大块 的图像相似度比较高,小块的单元细节部分明显,TU自动选择相应的变换块进行处理。
量化单元:将变换单元的数据量化成统一的模式。
熵编码:将编码数据编码为二进制码流进行传输,H265(CABAC),H264(CAVLC/CABAC)。
4)环路滤波器:
DF:去块滤波:重构图像存在方块效应,
SAO:像素点自适应补偿:补偿重构像素值,减少振铃效应。(EO、BO)
二、265解码器基本单元与语法结构
Profiles :规定编码器采用哪些编码工具和算法
1)Main profile:8bit、4:2:0
2)Main 10 profile:10bit
3)Main Still Picture profile:单个静止图片
Levels and tiers:
Level:根据解码器负载和存储情况对关键参数加以限制
Tires:最大比特率和CPB容量
main tier:用于大多数应用。
High tier:满足那些更严格的应用。
CTU-CTB
Previous: Picture -> slices -> MB
Luma:16x16 chroma 8x8 x2
HEVC
Picture -> slices -> CTUs
16x16, 32x32, 64x64 luma CTB
CU/CB CTU=1CU or CUs
CU:Intra-/inter- prediction 单元