基于NN的编码：In-loop filtering based on neutral network（Kwai）

最新推荐文章于 2021-08-04 20:55:45 发布

涵小呆

最新推荐文章于 2021-08-04 20:55:45 发布

阅读量472

点赞数 1

分类专栏：视频编码深度学习文章标签：深度学习视频编码环路滤波

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BigDream123/article/details/115482104

版权

视频编码同时被 2 个专栏收录

32 篇文章 32 订阅

订阅专栏

15 篇文章 3 订阅

订阅专栏

JVET-T0094

本提案提出了一种基于深度学习的环内滤波器。提出的环路滤波器位于Deblock和SAO级之间。基于VTM9.0的实现，对于AI和RA配置，所提出的基于深度学习的滤波器的平均{Y，U，V}BDbdrate性能分别为{-4.99%，-16.39%，-17.34%}和{-3.92%，-18.09%，-16.93%}。

如下图所示，所提出的NN Filter位于DB和SAO之间。

网络结构

所提出的神经网络结构如图（a）所示，结构包括残差块（RB）和二维上采样卷积。网络的输入为YUV三分量，首先将色度样本通过二维卷积从64x64上采样到128x128，然后与亮度样本级联，形成3x128x128的输入。

在图（b）中，残差块RB包含两个具有K个输入/输出特征的3x3卷积核。在本提案中，N和K分别被设置为20和64。

训练

在本提案中，在训练过程中使用了DIV2K数据集。原始RGB图像转换成YUV420格式后，采用AI配置的VTM9.0进行编码和解码。训练的QP为22、27、32和37。然后将重建图像分割成128x128亮度和64x64色度块。在训练过程中，batch大小设置为8。训练过程的epoch是20。

实验

提出的基于神经网络的环路内滤波器在VTM9.0中实现，具有CTU和帧级标志。如果“frame level”的标志关闭，则当前帧中的所有CTU不会使用提出的滤波器。如果开启帧级别的标志，则会发出CTU level的flag，以指示是否应用了提出的滤波器。

Anchor：VTM9.0
每个序列只使用前2帧
Anchor和测试都是在CPU中生成的

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
5
评论
基于NN的编码：In-loop filtering based on neutral network（Kwai）

JVET-T0094本提案提出了一种基于深度学习的环内滤波器。提出的环路滤波器位于Deblock和SAO级之间。基于VTM9.0的实现，对于AI和RA配置，所提出的基于深度学习的滤波器的平均{Y，U，V}BDbdrate性能分别为{-4.99%，-16.39%，-17.34%}和{-3.92%，-18.09%，-16.93%}。如下图所示，所提出的NN Filter位于DB和SAO之间。网络结构所提出的神经网络结构如图（a）所示，结构包括残差块（RB）和二维上采样卷积。网络的输入为YUV
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。