基于深度学习的环路滤波和残差缩放

Dillon2015

于 2022-08-30 22:20:04 发布

阅读量1.3w

点赞数 1

分类专栏： H.266/VVC 深度学习视频编码文章标签：深度学习人工智能环路滤波

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dillon2015/article/details/126513371

版权

视频编码同时被 3 个专栏收录

216 篇文章 56 订阅

订阅专栏

155 篇文章 141 订阅

订阅专栏

31 篇文章 5 订阅

订阅专栏

本文来自提案JVET-X0066和JVET-Y0143，在JVET-W次会议中提出了基于深度学习的环路滤波的提案，包括自适应参数选择和注意力机制的深度模型（EE1-1.2），以及残差缩放的深度模型(EE1-1.4)。此提案研究将两者结合的效果。

整个模型首先基于EE1-1.2修改，模型输入增加边界强度（BS）和QP，输入像素和经过模型滤波后的像素的残差再经过缩放因子来缩放。

网络结构

整个网络结构如Fig.1所示，其中注意力模型（attention model）的计算过程可以描述如下：

$F_{-}out=F_{-}in\times f(Rec,Pred,BS,QP)+ F_{-}in$

其中F_in和F_out分别是 attention model的输入输出，Rec,Pred,BS,QP分别表示重建值、预测值、边界强度和量化参数。f函数表示Fig.1.(b)中的两个卷积层和激活单元。

参数选择

每个slice或块都可以选择是否进行基于CNN的滤波，如果slice/block决定要使用基于CNN的滤波，则需要从候选列表{q,q-5,q-10}中选择条件参数，其中q是序列的QP。编码端的参数选择过程是基于RD cost的，如下：

滤波粒度决策和参数选择由分辨率和QP决定，对于更大的分辨率和QP决策和选择在更大的区域上进行。
对于不同时域层候选参数列表也不同，对于更高的时域层第三个候选q-10变为q+5。
对于all intra配置，禁用参数选择但仍保留标志位。

残差缩放

picture header中存有个分量的缩放因子，当对重建图像使用完基于CNN的滤波后，使用缩放因子对残差进行缩放。

推理和训练

使用PyTorch进行模型推理，具体信息如表1，

模型分别使用DIV2K和BVI-DVC数据集对I帧和B帧进行训练，对不同QP分别训练模型，具体如表2，

实验结果

实验平台选择VTM-11.0+new MCTF，其中DF和SAO关闭，在使用CNN滤波后再使用ALF处理，实验结果如下，

实验平台选择ECM3.0，其中DF关闭，在使用CNN滤波后再使用SAO和ALF处理，实验结果如下，

表9和10是基于NN的滤波和ECM3.0中的非NN滤波工具相结合后相对于VTM-11.0+new MCTF的结果，

感兴趣的请关注微信公众号Video Coding

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Dillon2015 CSDN认证博客专家 CSDN认证企业博客

码龄9年

274: 原创

2万+: 周排名

3319: 总排名

859万+: 访问

: 等级

1万+: 积分

1014: 粉丝

855: 获赞

412: 评论

2051: 收藏

私信

关注

热门文章

分类专栏

AV1 5篇
H.266/VVC 155篇
AVS3 18篇
多媒体 28篇
scikit-video 4篇
opencv图像处理 2篇
数据分析 9篇
python 29篇
windows 3篇
电脑设置 7篇
机器学习 9篇
数据库 2篇
spark 5篇
graphx 2篇
计网 5篇
sklearn 1篇
pybrain 4篇
tensorflow 5篇
概率论与数理统计 1篇
linux 2篇
深度学习 31篇
视频编码 216篇
h.265/hevc 66篇
scikit-video 2篇
ffmpeg 6篇
DSP 1篇
opencv 6篇
图像处理 5篇

最新评论

图像质量评价（二）：VSI
周言溪: 你好请问还有这篇VSI的源码吗比较需要
VVC帧间预测（一）扩展的merge模式
sky_young: 空域候选列表构造顺序好像有点问题，应该是按照B1->A1->B0->A0->B2的顺序建立
变换系数熵编码
Dillon2015: 还是挺明显的，你可以找个编码器比较一下开启和关闭SDH的效果
变换系数熵编码
华函数: 但SDH只能减少一个CG中最后一个非0系数的符号位比特，其他非0系数还是要通过CABAC旁路编码进行，对于最终的码率降低的比例明显吗，还会引入失真
图像质量评价（二）：VSI
2301_76724212: 你好，请问可以要一份这个代码嘛？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。