H.266/VVC相关技术学习笔记11:O次会议新接收的技术——色度预测模式编码的简化和统一

O次会议顺利结束,其中有不少新接收的技术提案,其中一个关于简化帧内色度模式编码的提案(O0671)我还是比较感兴趣的,开会之前并没有看到这篇提案,是后来上传的,结果是非常重要的一篇提案~

该提案的第一条建议就是无论CCLM模式是否开启,将相同的intra_chroma_pred_mode用于DM模式,以提高规范文本的可读性和一致性,该建议并不会影响压缩的性能。第二个建议为sps_cclm_enabled_flag = 0(CCLM关闭)和1(CCLM开启)都使用一个二值化表。

关于VTM5.0中帧内色度模式编码的技术细节我在之前的博客已经详细讲过啦,这里就直接给出链接: H.266/VVC代码学习笔记2 :深入解析帧内色度预测模式的编码方式及其代码详解

前几天也做了一篇开会之前已经上传的有关帧内色度模式编码的三家提案,这三家提案为了消除上下文编码的依赖性并简化模型和减少上下文模型的使用数量,修改了对应的色度模式编码。具体的细节可以看我之前的博客:H.266/VVC相关技术学习笔记:JVET——O次会议关于色度预测模式编码的一些修改

但是在O次会议上,高通(Qualcomm)又提出了这篇统一简化模式编码的方案,直接把前三家的提案给打压下去了,不过最终会议决定将O0416和O0671作为联合提案,最为最终的方案!,下面我详细介绍一下本篇提案的详细的技术细节~

原来的VTM5.0中的色度预测模式编码方式大致如下:
CCLM关闭的时候,即sps_cclm_enabled_flag =0,DM的模式号为4;
在这里插入图片描述
CCLM开启的时候,即sps_cclm_enabled_flag =1,即DM的模式号为7.
在这里插入图片描述
如果对表格中的数据有些不太清楚地同学可以去我之前的有关DM的博客看一下,里面讲了有关该表格的解释,链接如下:H.266/VVC学习笔记:帧内色度预测模式中的DM模式及其在N次会议上相关的提案总结

该技术对上述的模式编码方式进行了简化和统一,不管sps_cclm_enabled_flag值是0还是1,DM_CHROMA模式对应的intra_chroma_pred_mode =4。如下表所示:
在这里插入图片描述
然后在以上技术改进的基础上,又对sps_cclm_enabled_flag=0和1都只使用一个统一的CABAC编码方式,且总共使用了三个上下文模型以及旁路编码器,其中,
红色:上下文模型1;
蓝色:上下文模型2;
绿色:上下文模型3;
黑色:旁路编码。
具体编码方式如下表所示:
在这里插入图片描述
这里,第一个比特位表示它是常规角度模式(0)还是CCLM模式(1)。
① 如果它是常规模式,则第一个比特位编0,后面三个比特位的推导和VTM5.0中的方式一样。
② 如果它是CCLM模式,则第一个比特位编1,,第二个比特位指示它是LM模式(0)还是MDLM(1)模式。
③ 如果不是LM模式,则第二个比特位编1,第三个比特位表示它是MDLM_L(0)还是MDLM_A(1)。

实际上,当sps_cclm_enabled_flag为0时(即CCLM不可用),可以在熵编码之前丢弃用于对应的intra_chroma_pred_mode的二进制表的第一个比特位。或者,换句话说,第一个比特位被推断为0,因此不被编码。这样一个统一的二进制表适用于sps_cclm_enabled_flag为 0和1的情况。

该技术所改进的模式编码方式中,DM_CHROMA模式比原始二进制化多使用1个比特,LM_CHROMA模式使用相同数量的比特数进行编码,而其他6个模式相比原来的编码方式少使用1个比特数。

值的注意的是,原始色度模式编码和当前接收的技术中使用相同数量的上下文模型(都为3个)。对于帧内色度模式编码,建议对每个比特位的上下文模型的选择进行下表所示的更改,加粗标红的地方就是更改的地方。
在这里插入图片描述
最终的性能如下表所示,分别是AI、RA、LD上的性能:
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值