图像压缩之《A Unified End-to-End Framework for Efficient》

论文地址:https://arxiv.org/pdf/2002.03370.pdf

代码地址:暂未公布

摘要

针对目前最新的深度学习图像压缩所遭遇的计算复杂性,本文提出了一个称为高效深度图像压缩(Efficient Deep Image Compression, EDIC)的统一框架,该框架基于三个新的技术:通道注意力模型,高斯混合模型以及解码端增强模型。整个编解码框架基于Balle的超先验图像压缩模型,通过利用通道注意力机制获取隐藏表示的通道之间的关系来提高编码效率;在熵编码中引入高斯混合模型提高了比特率估计的准确性;解码端增强模块可以进一步增强图像压缩的表现。此外,EDIC框架还可以配合DVC(Deep Video Compression,Guo Lu发表于CVPR2019的文章)框架来提高视频压缩的表现。EDIC在提升图像编码变现的同时也稍稍增加了计算复杂性。实验证明,EDIC方法超越了现有最新的方法,同时也提升了DVC的性能。

模型:EDIC

整个模型的基本框架是基于Balle的模型改进的,主要改进内容:

1. 引入通道注意力机制进一步去除信息冗余;

2. 相较于Balle的单高斯模型压缩能力的限制,高斯混合模型可以进一步提升压缩性能;

3. 加入增强模块可以提升重构图像的质量;

其EDIC框架图如下图所示:

整个模型的优化目标为

 其中,d\left ( x, \hat{x} \right ) 为失真损失,H\left ( \hat{y}\right )H\left ( \hat{z} \right ) 为熵损失。

通道注意力方法

Balle的自回归先验模型就可以获取隐藏表示的空间关系进而提升了压缩性能,与此同时,一些使用空间注意力机制(如non-local blocks)的图像压缩方法也是旨在减少空间冗余。基于这些现有方法的启发,作者提出了一个轻量型的通道注意力方案如下图所示。

 通过非线性变换等操作获取特征图在通道之间的关系,进而对特征图进行加权。

高斯混合模型

在Balle等提出的编解码模型中作为熵估计的超先验编解码模块,其作用就是用于估计隐层特征的高斯分布mu和sigma。虽然相较于之前的基于深度学习的图像压缩方法,基于单个高斯的熵模型以及达到了非常好的效果,但是单个高斯模型的能力仍旧有限,特别是对于一些复杂的图像内容,所以作者使用高斯混合模型来进一步提升图像压缩的效率。具体的,对于隐层特征y_hat的分布估计由下述公式表示,

 其中wi是不同高斯模型的权重,F是高斯模型的数量,实验中F=2。高斯混合模型的结构如下图所示。

 解码端增强

为了进一步提升重构图像的质量,作者在解码端重构出图像之后引入增强模块。增强模块如下图所示;

 视频压缩中的应用

为了进一步说明本方法的有效性,将EDIC模型嵌入到视频压缩模型中,其框架图如下所示;

 其中残差和运动信息由EDIC方法压缩,具体细节以及实验结果分析,可视化结果等请参考论文。

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值