CVPR 2020|超越H.265,中科大使用多帧数据改进视频压缩新方法

随着深度学习的兴起,可学习的视频压缩( learned video compression)方法也越来越引起研究学者的重视。

CVPR 2020 的论文 M-LVC: Multiple Frames Prediction for Learned Video Compression ,来自中国科技大学的学者提出一种参考多帧的预测方法,改进了低延迟场景的端到端 learned video compression方法。

01

方法

文章指出,之前的方法多只用前一帧作为参考,该文指出使用前面多帧作为参考,其可以实现:

  1. 更加精确预测当前帧,使得残差数据量更小;

  2. 有助于生成motion vector (MV)预测,降低MV域的编码代价;

作者使用两个自动编码机(auto-encoder)分别压缩残差和MV,为补偿压缩错误,结合多帧数据引入残差和MV的提精网络。

该算法是在DVC基础上发明的,下图展示了该文的压缩模式,蓝色高亮部分为该文提出的新模块。

在三个数据集上与H.264 , H.265 , DVC 方法的压缩结果比较,可见在PSNR和MS-SSIM上均实现明显的效果提升。

02

编解码速度

作者使用Titan Xp GPU测试了模型的推断速度,在352x256分辨率视频上,编码帧率2.7fps,解码帧率5.9fps。

还需要更多的优化,才能达到实时编解码。

03

结果

实验结果显示,在低延迟模式下该文方法打败了之前的可学习的压缩方法,另外在与工业标准H.265比较中,PSNR和MS-SSIM也取得了更好的结果。

作者称代码和模型均将开源。

04

传送门

论文地址:

https://arxiv.org/pdf/2004.10290.pdf

开源地址:

https://github.com/JianpingLin/M-LVC_CVPR2020

(目前还未开源)

END

备注:视频压缩

视频编解码交流群

视频压缩、图像压缩等技术,

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
2020年的计算机视觉与模式识别国际会议(CVPR,小样本学习成为了一个热门话题。在CVPR 2020,许多重要的研究都集于小样本学习解决方案。 小样本学习的意义在于模型如何从很少的数据学习。在现实世界,我们面临的很多问题都是小样本问题,例如医学影像分析,金融风险评估,自然语言处理等等。采用小样本学习的方法为这些问题提供了有效的解决方案。 在2020年的CVPR,研究者们提出了许多小样本学习算法和模型。其最重要的是元学习。元学习在小样本学习非常重要。元学习的基本思想是通过迁移学习,让模型从不同数据进行学习并进行知识迁移学习。在元学习,一个模型会从一个任务学习并推广到其他任务。 另一种常见的小样本学习方法是采用生成式对抗网络(GANs)进行特征提取和图像生成。研究者们使用GANs来生成的图片样本,从而增加数据样本的数量。这种方法在小样本学习非常有用,因为GANs可以生成无限数量的样本集。 总之,小样本学习在计算机视觉和模式识别领域变得越来越重要。在CVPR 2020,我们看到了许多方法和技术的出现,它们为解决小样本学习问题提供了前所未有的解决方案。我们相信,随着更多的研究和技术的进步,小样本学习将成为计算机视觉和模式识别的重要工具。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值