ELIC 论文阅读笔记

1. 论文基本信息

发布于: CVPR 2022

2. 创新点

  1. 文章结合空间上下文模型,提出了一种多维熵估计模型 SCCTX(该模型在降低比特率方面快速有效)
  2. 基于所提出的 SCCTX 模型,进一步提出了 ELIC 模型,采用堆叠残差块作为非线性变换。
  3. 提出了一种从压缩表示生成预览图像的有效方法。这是第一个解决学习图像压缩的超快预览问题的文献。

3. 背景

  1. 利用熵模型压缩图像,使用可微分的方法来监督并优化压缩模型,以最小化压缩后数据的期望负熵,从而提高压缩效果(在信息理论中,负熵可以被理解为数据的不确定性或者压缩后的数据的预期信息量。
  2. 在熵模型压缩图像的基础上引入了反向自适应编码:比如使用了空间上下文模型(考虑了图像之间相邻像素之间的关系提高压缩效率)、使用通道条件模型(利用图像通道之间的统计信息,以更好的压缩图像)

4. Pipeline

4.1. Parallel multi-dimension context modeling (并行多维上下文建模)

4.1.1. Unevenly grouped channel-wise context model 不均匀分组的通道上下文模型

信道条件(CC)自适应编码的不均匀分组。M 通道编码符号 ^y 被分成 5 个块,通道数逐渐增加 Ck。

论文提出了一种不均匀的分组方案,通过使用更少的通道将更细的粒度分配给开始块,并通过使用更多的通道逐步增长以下块。因此,对于具有 M 个通道的符号 ^y,我们将它们沿通道维度拆分为 5 个块 ^y(1)。, ^y(5) 分别有 16、16、32、64、M -128 个通道。

4.1.2. SCCTX: space-channel context model 空间通道上下文模型

空间上下文模型通道条件模型消除了沿空间和通道轴的冗余。

在第 k 个不均匀分组的块中,应用空间上下文模型 g(k) sp 来识别空间冗余。它可以是自回归卷积或其双通道并行自适应模型。引入了 gc 网络来对通道上下文 Φ(k) ch 进行建模。第 (k, i) 个位置 Φ(k) sp,i 和 Φ(k) ch 处的空间和通道分支的输出将与超先验表示 Ψ这些信息用于确定熵编码过程中的编码长度或者解码过程中的解码器行为)连接并馈入位置聚合网络以预测熵参数Θ(k)i = (μ(k)i , σ(k)i ) 对于 ^y(k)i 的以下 编码或解码。然后唯一获得的 ^y(k)i 将用作上下文来计算 Φ(k) sp,(i+1) 或 Φ(k+1) ch ,直到 编码或解码整个 ^y。

使用神经网络对图像进行编码的过程中 能输出多个维度的特征 而 把同一个维度的特征堆积在一起就是一个通道的特征 起始通道在这里代表的是 前几维度堆积在一起的特征。

4.2. ELIC: efficient learned image compression with scalable residual nonlinearity 具有可扩展残差非线性的高效学习图像压缩

  • RBS表示右侧所示的残差瓶颈块的堆叠(文中提到使用嵌套的残差瓶颈块能引入更多的非线性,有效的提升压缩性能,并且比使用类似全局注意力的方式更加高效,使用多层嵌套的残差瓶颈块来代替传统的线性归一化层)。
  • Attn 块是 Cheng 等人提出的注意力模块。
  • AE 和 AD 分别是算术 en/de-coder。
  • TConv 表示转置卷积。
  • 蓝色和红色箭头表示编码和解码数据流。
  • 橙色的是通过编码和解码共享的。
  • Q 可能是量化

提出的缩略图合成器的结构。双线性模块将三个双线性上采样层表示为 2 倍。

论文中建议训练一个额外的微型网络,称为缩略图合成器,将低分辨率图像重建为缩略图预览。在采用 SCCTX 时,大多数语义信息在早期解码的通道中被压缩。因此,建议仅从前 4 个块(即前 128 个通道)生成预览图像。在训练主模型后,冻结所有学习参数,并将主合成器更改为初始化的缩略图合成器。然后重新启动失真优化来训练模型。由于所提出的缩略图合成器非常轻,它的解码只需要几个微秒(w.r.t.768 × 512 图像)。与通过从完全重建的全分辨率图像中进行下采样来获得预览图像相比,使用所提出的模型来获得缩略图预览图像效率更高。

5. 💎实验成果展示

多尺度结构相似性(Multi-Scale Structural Similarity)。它是一种用于衡量图像质量的指标,特别是在评估压缩算法效果时常被使用。
MSE是均方误差(Mean Squared Error)的缩写。在图像压缩中,MSE通常用于衡量压缩后图像与原始图像之间的差异或失真程度。

  • 17
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Xxxy _

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值