ICIP2021:基于CNN的环路滤波

155 篇文章 141 订阅
31 篇文章 5 订阅

本文来自ICIP2021论文《CNN Based In-loop Filter For VVC Intra Coding》

VVC提供了三种环路滤波器:SAO、Deblocking、ALF来减少压缩失真,但是手工设计的滤波器难以处理复杂的压缩失真。

论文提出基于CNN的环路滤波技术来提升VVC中I帧的质量。网络输入包括从重建像素中提取的特征以及划分、预测信息,对于色度分量的输入还包括亮度像素。

Input


整个网络结构如Fig.1所示,其中输入部分在图的左侧。输入包括重建信息、划分信息以及预测信息。由于现有的环路滤波处理可能丢弃一些信息,所以这里使用的重建信息不经过现有的环路滤波处理。输入还包括划分信息以及预测信息,这是因为它们和压缩失真、重建误差都有很大关系。为了使划分信息和重建信息维度一样,使用均值填充CU。

为了使这三类信息融合到一起,首先使用卷积层分别提取特征,然后将三组特征作为不同通道连接起来,再通过一个卷积层缩减特征维度。

Backbone


网络骨干包括一个卷积层和几个顺序堆叠的残差块。卷积步长设为2以增大感受野和降低复杂度。使用残差块能加快收敛速度。论文在M和R分别设为128和16。

训练


损失函数的选择对网络训练至关重要,使用MSE可能陷入局部极小值而MAD的梯度固定,因此论文先使用MAD训练来避免陷入局部极小值然后使用MSE微调。此外,还使用旋转、镜像、缩放等方法对训练集进行数据增强。

实验结果


实验配置


训练框架实验PyTorch,训练集使用DIV2K,包含800个训练图像和100个验证图像。对不同QP分别训练模型,模型集成到VTM10.0,使用All intra配置,QP={22,27,32,37}。

结果


和VTM10.0相比,基于CNN的环路滤波YUV的BD-Rate增益分别是7.57%, 13.18%, 12.50%,表1是和相关研究的对比。

感兴趣的请关注微信公众号Video Coding

BMVC(British Machine Vision Conference)和ICIP(International Conference on Image Processing)都是计算机视觉领域的重要学术会议,它们都提供了一个交流和展示最新研究成果的平台。选择参加哪个会议取决于你的具体需求和兴趣。 1. BMVC:BMVC是一个由英国计算机视觉学会(British Machine Vision Association,BMVA)主办的国际会议。BMVC是计算机视觉领域的顶级会议之一,吸引了来自世界各地的学术界和工业界的研究人员。BMVC的重点是机器视觉和图像分析领域的研究,涵盖了广泛的主题,包括图像处理、目标检测与识别、图像分割、三维视觉等。如果你对英国的计算机视觉研究感兴趣,或者想要了解该领域最新的研究动态,参加BMVC是一个不错的选择。 2. ICIP:ICIP是由IEEE Signal Processing Society主办的国际会议,也是图像处理领域的重要会议之一。ICIP涵盖了从图像获取、处理和分析到图像应用的广泛范围。该会议汇集了来自学术界和工业界的专家,提供了一个交流和讨论最新研究成果的平台。如果你对图像处理的基础理论、算法和应用感兴趣,或者想要与世界各地的研究人员建立联系,参加ICIP是一个不错的选择。 总的来说,选择参加BMVC还是ICIP取决于你的研究方向、兴趣和目标。你可以根据自己的需求仔细查阅两个会议的往届论文、议程和主题,以及考虑参会成本和地点等因素,来做出最适合你的选择。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值