c语言图像压缩算法实现_CVPR 2020 论文:基于GMM和Attention的图像压缩

357a2a36b98bc5c941f696e798226ec4.png

论文:Learned Image Compression with Discretized Gaussian Mixture Likelihoods and Attention Modules

概要:

基于深度学习的图像压缩方法近几年迎来了快速的发展,但在基于学习的压缩算法和现行压缩标准之间仍然存在性能差距,尤其是在广泛使用的PSNR指标上。本篇论文探讨了最近的可学习的图像压缩算法中仍存在的问题,作者发现准确的熵估计模型影响着模型的参数优化,进而影响rate-distortion optimization的性能。因此,作者提出使用离散的高斯混合似然来参数化潜在表示的分布,可以获得更准确和灵活的概率模型。此外,作者还使用attention module来提高网络对图像中复杂区域的关注能力。实验表明,,本方法是第一篇可以在PSNR指标上达到VVC的intra压缩性能的工作。同时,由MSSSIM优化的模型可以生成视觉效果更好的复原图像。

论文地址:

Learned Image Compression with Discretized Gaussian Mixture Likelihoods and Attention Modules​arxiv.org

代码地址:

https://github.com/ZhengxueCheng/Learned-Image-Compression-with-GMM-and-Attention​github.com

主要方法:

首先,作者回溯了近几年在learned image compression上取得的进展,尤其是以hyperprior和起变形结构为代表的熵估计模型(如下图的(b)(c)所示),很大程度地提高了压缩性能。

1dabd7502d2570e9414fc39dc9105b62.png
Fig. 1 Operational diagrams of learned compression models (a)(b)(c) and proposed Gaussian Mixture Likelihoods (d)

在此基础上,作者发现仅估计单个均值仍然无法获得更准确的估计,可视化结果如Fig. 2所示,由此,作者提出使用离散高斯混合模型来对latent representation进行熵估计,这样可以对y提供多个最可能的均值,而每一个mixture的方差可以更小,达到的效果是实现更准确的概率模型,节约编码y所需要的比特数。

078137da84ec8767a022d93339f285fa.png
Fig. 2 Visualization of different entropy models for the channel with the highest entropy using kodim21 from Kodakdataset as an example. It shows our approach provides a more flexible parameterized distribution models with smaller scaleparameters and better spatial redundancy

第二,作者还加入了简化版的attention modules,可以提高网络对于non-zero responses,即复杂区域的关注,同时不引入过多的训练复杂度。综上所示,整体的网络结构如Fig.3所示。

dd9bcd265d0e3c3b5be974ff182767c9.png
Fig. 3 Network Architecture.

实验结果:

作者在Kodak和CLIC validation两个数据集上进行了测试。在Kodak数据机上,PSNR的表现可以与VVC intra压缩的性能相匹敌,远超HEVC-intra的压缩算法,并且达到了state-of-the-art的压缩性能,RD曲线如下图所示。

88e18cd5a3241df125f01f6378b3f677.png
Fig. 4 Rate-distortion performance on Kodak dataset

同时作者还给出了可视化的结果,显示MS-SSIM优化的模型可以生成视觉效果更好的图片。

3fb02b2f3daa585607f84ca1bbbe5336.png

9dc674f456c6128ece48854c2dc56c45.png
Fig. 5 Visualization results

最后,如果这篇文章对你的研究有帮助的话,欢迎引用!

@inproceedings{cheng2020image,
title={Learned Image Compression with Discretized Gaussian Mixture Likelihoods and Attention Modules},
author={Cheng, Zhengxue and Sun, Heming and Takeuchi, Masaru and Katto, Jiro},
booktitle= "Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)",
year={2020}
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值