VCIP2021:基于神经网络的双向预测blending过程

最新推荐文章于 2024-04-09 10:49:30 发布

Dillon2015

最新推荐文章于 2024-04-09 10:49:30 发布

阅读量1.5w

点赞数 1

分类专栏： H.266/VVC 视频编码文章标签：神经网络深度学习 BDOF

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dillon2015/article/details/125193563

版权

视频编码同时被 2 个专栏收录

215 篇文章 46 订阅

订阅专栏

155 篇文章 135 订阅

订阅专栏

本文来自VCIP2021论文《Neural Network based Inter bi-prediction Blending》

介绍

双向预测最终会产生两个MV和两个参考块，这两个参考块通过加权最终形成一个预测块，这个过程即为blending。双向预测能减少编码失真、亮度变化、块内小运动引起的误差。

VVC中提出了多种工具来提升双向预测过程的表现，例如BCW技术对两个参考块分别赋予一个权重，最终的预测块由两个参考块加权生成，相比在HEVC中进行双向预测时预测值等于前向预测值和后向预测值的均值，BCW的加权预测效果更好，同时为了降低复杂度BCW使用一组固定权重{-1/4,3/8,1/2,5/8,5/4}。另一个技术是BDOF，基于光流的概念计算出来的运动修正值来调整4x4子块的双向预测值。还有一个技术是几何划分GPM，每个像素的权重取决于它到边界的距离。最后还有一个技术是CIIP，它将帧内预测和帧间预测结合了起来。

基于神经网络的双向预测blending

简介

论文提出使用神经网络来进行双向预测时两个参考块的blending过程。网络模型通过全连接神经网络构成，输入是两个参考块，输出是最终的预测块，网络结构如Fig.1所示。

应用条件：

该方法不需要在码流中传输额外信息，但是需要一些条件限制其是否开启。由于该方法和BDOF不兼容，所以论文中关闭了BDOF。且该模型仅在亮度分量上训练，对于色度分量还是使用原始的blending方法。为了平衡复杂度，设置了三个档次的开启条件，如表1所示。

实验结果

训练数据集使用BVI-DVC和UVG数据集，使用STAD作为loss 函数，使用Hadamard矩阵进行变换。具体信息如表4所示。

实验平台使用VTM11.0，QP={22，27，32，37，42}。

模型大小比较

首先比较网络大小的影响，使用RA配置，从表5和表6可得，大模型的gain增加了0.5%但是解码复杂度增加了40%

不同配置比较

表7和表8比较了不同配置下的效果，

LDB配置

一个有趣的现象，该工具在LDB配置下也会有增益，如表9，在LDB配置下两个参考帧都来自前面，而BDOF在LDB配置下效果不好。

该工具在VTM上相比于BDOF的效果如表10，BD-Rate增益2.2%以上。

感兴趣的请关注微信公众号Video Coding

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
3
评论
VCIP2021:基于神经网络的双向预测blending过程

本文来自VCIP2021论文《Neural Network based Inter bi-prediction Blending》介绍双向预测最终会产生两个MV和两个参考块，这两个参考块通过加权最终形成一个预测块，这个过程即为blending。双向预测能减少编码失真、亮度变化、块内小运动引起的误差。VVC中提出了多种工具来提升双向预测过程的表现，例如BCW技术对两个参考块分别赋予一个权重，最终的预测块由两个参考块加权生成，相比在HEVC中进行双向预测时预测值等于前向预测值和后向预测值的均值，BCW的加权预测
复制链接

扫一扫

专栏目录

Dillon2015 CSDN认证博客专家 CSDN认证企业博客

码龄9年

272: 原创

2万+: 周排名

1365: 总排名

850万+: 访问

: 等级

1万+: 积分

943: 粉丝

794: 获赞

406: 评论

1926: 收藏

私信

关注

热门文章

分类专栏

AV1 4篇
H.266/VVC 155篇
AVS3 18篇
多媒体 28篇
scikit-video 4篇
opencv图像处理 2篇
数据分析 9篇
python 29篇
windows 3篇
电脑设置 7篇
机器学习 9篇
数据库 2篇
spark 5篇
graphx 2篇
计网 5篇
sklearn 1篇
pybrain 4篇
tensorflow 5篇
概率论与数理统计 1篇
linux 2篇
深度学习 31篇
视频编码 215篇
h.265/hevc 66篇
scikit-video 2篇
ffmpeg 6篇
DSP 1篇
opencv 6篇
图像处理 5篇

最新评论

AVS3变换之IST和ISTS
Dillon2015: IST只有在调整非零系数数量奇偶性时对某个系数置零
AVS3变换之IST和ISTS
Mgo666: 问下，IST下DST7的32×32情况，高频系数有被置成0吗。就是只有左上角16×16存在非零系数
scipy.interpolate.lagrange
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/8056186, 请多输出高质量博客, 帮助更多的人
自适应QP(Adaptive QP)
如醉方醒...: 你好，请问在compress一个ctu后分别打印m_ppcBestCU[0]和[1],[2],[3]的QP值，深度0和深度1，2，3的结果不同，深度1，2，3的QP是相同的，哪个值才是ctu的QP值呢？
自适应QP(Adaptive QP)
Dillon2015: 一样的

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。