ELIC:基于非均匀分组空间信道上下文自适应编码的高效学习图像压缩

论文:ELIC: Efficient Learned Image Compression with Unevenly Grouped Space-Channel Contextual Adaptive Codingc​​​​​​

近年来端到端图像压缩展现出惊人的潜力,目前性能最佳的模型已经超过了VVC-Intra的性能。上下文模型是性能提升的主要来源之一,但随之而来的是漫长的编解码时间,导致了无法实时编解码。本文提出了一种新的上下文模型,在保证压缩效率的同时大大降低了编解码时间。

Contribution:

1 将棋盘式上下文模型和通道上下文模型结合,提出空间通道上下文(SCCTX)模型,有效降低了比特率的同时不影响编码速率;

提出非均匀通道分组方案,提高了编码速率;

使用堆叠残差块作为非线性变换,替代GDN

4 提出一种高效的从潜在特征生成预览图的方法。​​​​​​​

整体网络架构

SCCTX

在通道内采用空间棋盘式模型,通道间采用通道上下文模型。以第一、二层为例,先解码第一层的锚点,利用空间棋盘式上下文模型解码非锚点。至此,第一层解码完毕。第二层的锚点利用通道上下文解码第二层的锚点,如右图所示。

非均匀分组

上图为前10最大平均能量的排序通道的可视化,左1原始图像,可以看出主要能量集中在第一个通道,其余通道逐渐变得稀疏。较早的编码组中特定通道具有更大的熵,主要信息隐式集中在开始通道上,被用于预测后续组。后续通道中包含较少信息,并且较少用于预测后续组。因此可以将稍后的编码通道合并成更大的组来减少跨组预测,从而加快速度。

堆叠残差块

使用堆叠残差块来代替广义除法归一化 (GDN) ,即使没有 GDN 层,具有足够强非线性的网络也可以更好地表达中间特征。通过简单地堆叠残差块仍然可以提高 RD 性能。

 快速解码预览缩略图

通过训练一个额外的微型网络,称为缩略图合成器,以重建低分辨率的缩略图预览。由于大多数语义被压缩在较早的通道中,仅从前 128 个通道生成预览图。与从完全重建的全分辨率图像中通过下采样获得预览图像相比,使用该模型获得缩略图预览图像的效率要高得多。

 实验结果

ELIC 获得了 7.88% BD-Rate 增益, ELIC- sm 是基于 ELIC 的精简结构,它通过去除注意模块和减少 res-block RB×1 )来改进 ELIC 。它还实现了显着的 RD 性能,同时显着降低延迟。

Cheng2020Learned Image Compression With Discretized Gaussian Mixture Likelihoods and Attention Modules,复合熵模型、残差连接实现attention。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值