一种快速帧内编码算法

最新推荐文章于 2022-01-28 13:14:52 发布

NDnarg

最新推荐文章于 2022-01-28 13:14:52 发布

阅读量819

点赞数 1

分类专栏： VVC 视频编码文章标签：视频处理

本文链接：https://blog.csdn.net/NDnarg/article/details/109297762

版权

视频编码同时被 2 个专栏收录

20 篇文章 1 订阅

订阅专栏

VVC

6 篇文章 2 订阅

订阅专栏

相比HEVC，VVC所用到的具有嵌套的多类型树（QTMT）是有效改进之一，这种QTMT分区可以应用于每一个叶节点，这就产生了更加灵活的块大小。除此之外，帧内预测模式从35扩展到67，以满足各种纹理模式。但是，这也导致了比较高的计算复杂性。本文主要提出的是：由低复杂度编码树单元结构判决和快速帧内模式判决组成的快速帧内编码算法。

引言

块划分结构作为编码层的核心，得益于灵活的块大小，这导致获得了巨大的编码性能增益。编码树单元首先被四叉树分割，然后，通过多类型树结构进一步划分四叉树叶节点。此外，为了简化CTU分区，一旦CU被MT分区，QT在后续的分区过程中就不再有效。如下图，可以看出，获得最佳CTU结构的过程非常复杂，因此，有必要找到一种有效方法应用于VVC，可以快速找到最佳CTU划分结构。在这里插入图片描述
为更好去除帧内冗余，VTM扩展了帧内预测模式数量，需要两遍帧内预测来获得最佳预测模式。第一遍预测中，用DCT-II模式来执行67个帧内模式，包括两个非定向模式（DC模式和平面模式）和65个定向模式，如下图所示：在这里插入图片描述
在第二遍预测中，由RMD(Rough Modes Decision)+MPM(Most Probable Modes)构建的所有帧内候选模式使用其他变换度量来执行RDO评估，当然，这也是非常耗时的。
本文主要提出了一种低复杂度的CTU分割判决方法和一种快速帧内模式判决方法。

快速帧内编码算法

1.基于统计学习的低复杂度CTU结构决策方法

VVC中，包括不划分模式，总共有6中划分模式，每个CU选择RD cost最小的一个，即最优划分模式：在这里插入图片描述

下图显示了分区顺序：在这里插入图片描述
为找到最佳分区，需要依次递归执行各种分割模式，然后计算他们的RDO。但是，用RDO检查所有分区模式这一过程非常耗时。为降低这一过程复杂度，本文在不对分区模式计算的情况下，提前预测每个CU的分区模式。
现有的快速划分决策框架如下：
第一种：如下图，首先执行当前深度的帧内预测，利用帧内预测信息确定递归分区是否终止。如果没有终止，一次计算所有分区模式，这种算法一个弊端是当当前CU决定分成子CU时，就没必要计算当前CU了。在这里插入图片描述
第二种：在帧内预测之前仅选择一种分割模式，这样固然提升了编码时间，但是划分模式预测精度有限，如下图：
第三种：提出一种并行决策框架，QT和MT划分时独立确定的。QT和MT都被确定为终止，CTU分区才终止，如下图：在这里插入图片描述
本文提出的新型CTU快速划分决策：在当前分区模式中，如果可以预先决定QT分区，那么就可以跳过BT和TT分区，这样就可以降低更多的复杂度。基于此，提出一种级联决策框架，如下图。首先进行QT划分决策，如果当前CU确定使用QT划分决策，则在当前CU跳过所有MT分区；如果当前CU不使用QT分区，则分别确定剩余的四种分区类型。这样，一个多分类问题就转变成了多个二分类问题。在这里插入图片描述
本文主要利用三个特征来进行CTU划分决策：全局纹理信息、局部纹理信息、上下文信息。
全局纹理信息：使用5个特征来衡量CU相似性和纹理方向：块大小、归一化梯度、归一化最大梯度幅度、水平方向和垂直方向的平均梯度。
局部纹理信息：用xUBD和xLRD两个局部特征。xUBD展示了CU的上半部分和下半部分的区别；xLRD展示了CU左半部分和右半部分的区别。通过局部纹理方差来评估差异。
上下文信息：在CTU结构决策中采用了两个来自相邻CU的特征。CU的QTMT深度QTMTD=QD+MD（QD是四叉树深度、MD是多类型树深度）。第一个特征：QD大于当前CU的邻CU的数量，用xNQT表示；第二个特征：QTMTD大于当前CU的邻CU的数量，用xNQTMT表示。这两个值越大，意味着当前CU更有可能被划分成更小的子CU；这两个值越小，表明当前CU的划分极有可能停止。

2.基于一维梯度下降搜索的快速帧内模式决策

下面算法给出了描述：在这里插入图片描述
此外，当前的帧内编码是两遍预测，其目的是找到预测残差的最优变换核。在第二遍，第一遍中所有RMD模式和MPM模式被用于测试RDO。

3.该算法的框架

如前所述，提出的算法包括两个阶段的决策：低复杂度CTU结构和快速帧内模式决策。VVC中低复杂度CTU结构决策的基本思想就是修剪复杂的QTMT分区结构，以跳过一些不必要的CU上的帧内预测过程。快速帧内模式决策在于减少用于执行哈达玛帧内预测和RDO的模式数量。如下图展示了为CTU提出的整体快速帧内编码算法的流程图。在这里插入图片描述
它首先计算多个特征来测量纹理属性和上下文相关。然后，这些特征被用作训练的决策分类器的输入，以判断处理单元是否应该被划分到更高的深度。对于帧内预测，当处理单元的所有想邻块都存在，执行所提出的基于梯度下降的快速帧内模式搜索；如果相邻块不存在时，则引入原始的MPM+RMD模式搜索策略。

总结

本文提出了一种快速帧内编码算法，用于VVC。这种快速编码算法结合了基于统计学习的低复杂度CTU结构推导方法和基于梯度下降的快速帧内模式判定方法。这种算法在编码效率和复杂度降低之间取得了良好的平衡。

NDnarg

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
一种快速帧内编码算法

相比HEVC，VVC所用到的具有嵌套的多类型树（QTMT）是有效改进之一，这种QTMT分区可以应用于每一个叶节点，这就产生了更加灵活的块大小。除此之外，帧内预测模式从35扩展到67，以满足各种纹理模式。但是，这也导致了比较高的计算复杂性。本文主要提出的是：由低复杂度编码树单元结构判决和快速帧内模式判决组成的快速帧内编码算法。文章目录引言快速帧内编码算法1.基于统计学习的低复杂度CTU结构决策方法2.基于一维梯度下降搜索的快速帧内模式决策3.该算法的框架总结引言块划分结构作为编码层的核心，得益于灵
复制链接

扫一扫

专栏目录