c语言图像压缩算法实现_Image Compression 图像压缩

本文探讨了基于深度学习的图像压缩算法,包括End-to-End Optimized Image Compression和Variational image compression with a scale Hyper-prior。这些算法利用分析变换、统一量化器和合成变换,以及复杂的先验和自回归模型,实现图像的高效压缩和高质量恢复。通过引入高斯混合模型和上下文信息,优化损失函数以平衡压缩比率和失真率。同时,介绍了Decoder Side Information的概念,用于加速解码过程。
摘要由CSDN通过智能技术生成

e9999e1d3275b70454efe68d4dd18e0f.png

随着互联网技术的飞速发展,对于图像/视频数据的存储、传输等实际应用的需求也不断扩增。今天来简单介绍一下近期调研学习的,基于深度学习的图像压缩算法。

End-to-End Optimized Image Compression

文章来自ICLR2017,算法由analysis transformuniform quantizer synthesis transform组成。analysis transform过程包含三个重复阶段,每个阶段包括卷积线性滤波器+非线性激活函数,联合非线性的目的在于实现局部增益控制。由于uniform quantizer带来了梯度不可导,故引入proxy function代理函数实现网络端到端训练。松弛的损失函数可以看做通过VAE生成模型的对数似然,算法在PSNR、MS-SSIM测量指标下均优于JPEG及JPEG-2000方法。

4b786e357d0652e5f9c60d10910fac73.png

如上图所示,算法在编码空间将图像进行编码压缩得到R;转换至感知空间,计算图像的失真率D。

下图为算法的分析(编码)和合成(解码)模块。分别使用了升降采样,GDN、IGDN结构。

747cafad60b5ac366cf3fff3560c825a.png

GDN和IGDN

在Autoencoder模块中,使用了GDN[1](generalized divisive normalization)进行归一化处理。其类似一般CNN网络中的Batch Normalization作用,可以很好的捕捉图像的统计特性,并将其转换为高斯分布。GDN/IGDN公式如下,对应的在decoder阶段,使用GDN的逆IGND参与网络学习。下式中,k代表stage阶段序号,i,j代表像素位置。

74e684677015a0de680745a5141e4708.png

针对本文的更多细节这里不再展开,继续看下一篇~

Variational image compression with a scale Hype

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值