ICASSP2021：通过码率限制降低ME复杂度

最新推荐文章于 2024-01-01 15:33:39 发布

Dillon2015

最新推荐文章于 2024-01-01 15:33:39 发布

阅读量3w

点赞数 1

分类专栏： H.266/VVC 视频编码文章标签： MV IME

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Dillon2015/article/details/119122961

版权

视频编码同时被 2 个专栏收录

216 篇文章 56 订阅

订阅专栏

155 篇文章 141 订阅

订阅专栏

本文来自ICASSP2021《Relying on a Rate Constraint to Reduce Motion Estimation Complexity》

运动估计ME是视频编码中最耗时的部分之一，本文提出基于码率的MV候选项消除策略。研究发现最优MV通常在MVP附近，通过限制MV的码率缩小运动搜索窗口从而减少计算复杂度。本文方法不局限于某种运动搜索模式，可以适用于各种ME策略。在VTM上实验结果显示和TZ search相比本文算法在BD-Rate损失0.74%的情况下可减少80%的复杂度。

简介

ME是视频编码最耗时的部分之一，HM和VTM中运动搜索都使用TZ search算法。ME一般包括三步：

MV预测，利用相邻块的运动信息生成MVP，并以该MVP作为运动搜索起点。
整数运动搜索（IME），在以MVP为中心的区域内搜索cost最小的MV。
分像素运动搜索（FME），在上一步基础上进行修正。

本文算法改进的是第二步IME部分。

在ME中cost计算方法如下：

式中r是MVD的码率。d表示失真，用残差的SAD计算。由于对每个候选项都要计算失真，所以需要从内存中加载大量像素块非常耗时。

MVD的码率估计方法如下：

其中g(v)表示对整数v进行有符号指数哥伦布编码后码字的长度。可以通过查表计算。

Fig.1是以MVP为中心128x128区域内MVD码率的分布。

基于码率的候选项消除

研究发现TZ search算法中ME最终选择的最优MV大部分都在MVP附近，其中87%就是MVP本身，94%在MVP附近很小的菱形区域内。

Fig.3是VTM编码器最终选择的MV的空域分布的热力图。通过对Fig.1中的值和Fig.3中的值的对数计算皮尔森相关系数得到-0.89，表明随着码率上升选择的MV数量指数下降。由此可得出结论，大部分最优MV都在MVP周围很小的区域内即MVD码率很小。

所以本文算法通过跳过计算那些r(mv-mvp)>t的MV的cost来减少计算复杂度，其中t是阈值。通过r(mv-mvp)>t限制可以减少很多MV候选项，从而减少计算cost的时间，但是该方法不保证最终MV一定是最优的。

实验结果

本文中复杂度C的计算方式如下：

其中S是VVC中所有CU可能尺寸的集合，totalCandidates(s) 是尺寸为s的候选项数量，area(s) 是CU的面积。

复杂度相对降低量计算方式如下：

论文通过上面的方式计算复杂度，而不是通过编码器运行时间计算，可以避免编译优化或机器性能对结果的影响。

Fig.4是t=4时LDP和RA配置下的实验结果。

表1是RA配置下t=10和20时的结果，t=10时有三条序列BD-rate损失在1%以下，复杂度大幅降低。t=20时BD-rate损失很小，复杂度也有所下降。

表2是LDP配置下t=4的结果，可以看见除了F序列外，本文算法在BD-rate损失在合理范围内可达到80%以上复杂度降低。

感兴趣的请关注微信公众号Video Coding

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。