2019_A Swichchable Deep Learning Approach for In-Loop Filtering in Video Coding

本文提出了一种基于深度学习的视频编码环路滤波系统方法,包含压缩和激励滤波CNN(SEFCNN)结构,分层训练策略和自适应切换机制。SEFCNN由特征提取和增强子网络组成,适应不同编码场景。实验结果显示该方法在编码效率上超越现有技术,且计算复杂度可控。
摘要由CSDN通过智能技术生成

Abstract:

  • 深度学习在编码效率和主观质量上为视频编码的环路滤波提供了巨大的潜力。最先进的工作致力于网络结构设计并且利用单一强大的网络解决所有问题。相反,本文提出了一种基于深度学习的系统方法,包括有效的卷积神经网络结构,分层训练策略和面向视频编码器的切换机制。首先,我们提出了一种新颖的CNN结构,也就是压缩和激励滤波CNN(Squeeze-and-Excitation
    Filering CNN,SEFCNN)作为可选的环路滤波,为了捕获通道之间的非线性交互,SEFCNN由两个子网络组成,也就是特征提取子网络(Feature EXtraction, FEX)和特征增强子网络(Feature ENhancing,FEN)。然后我们开发了一种分层模型训练策略以使两个子网络适应不同的编码场景。对于具有小伪影的高速视频,我们使用FEX对所有类型的视频帧训练单个全局模型,而对于具有较大伪影的低速视频,使用FEX和FEN为不同类型的视频帧训练不同的模型。最后,我们提出了一种自适应增强机制,它可以在基于CNN和传统方法之间切换。我们选择性的将CNN模型应用到某些帧或者帧内的某些区域。实验结果表明提出的方案优于最先进的编码方法,而GPU加速后的计算复杂度是可以接受的。

Conclusion

  • 这篇文章提出了一种系统的基于CNN的方法来解决视频编码中的环路滤波问题,我们开发了一种新颖的网络架构SEFCNN,它由两个子网络FEX和FEN组成,以利用通道间的相关性和相互依赖性。在SEFCNN基础上,我们利用分层模型训练策略,针对不同的编码场景自适应的部署整个SEFCNN或者子网。在将该方案整合进视频编码器中时,我们采用了从帧级到CU级的切换机制,成功避免了双重增强效应,提高了编码效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值