近年来端到端图像压缩展现出惊人的潜力,目前性能最佳的模型已经超过了VVC-Intra的性能。上下文模型是性能提升的主要来源之一,但随之而来的是漫长的编解码时间,导致了无法实时编解码。本文提出了一种新的上下文模型,在保证压缩效率的同时大大降低了编解码时间。
Contribution:
1 将棋盘式上下文模型和通道上下文模型结合,提出空间通道上下文(SCCTX)模型,有效降低了比特率的同时不影响编码速率;
2 提出非均匀通道分组方案,提高了编码速率;
3 使用堆叠残差块作为非线性变换,替代GDN;
4 提出一种高效的从潜在特征生成预览图的方法。
整体网络架构
SCCTX
•在通道内采用空间棋盘式模型,通道间采用通道上下文模型。以第一、二层为例,先解码第一层的锚点,利用空间棋盘式上下文模型解码非锚点。至此,第一层解码完毕。第二层的锚点利用通道上下文解码第二层的锚点,如右图所示。
非均匀分组
上图为前10最大平均能量的排序通道的可视化,左1原始图像,可以看出主要能量集中在第一个通道,其余通道逐渐变得稀疏。较早的编码组中特定通道具有更大的熵,主要信息隐式集中在开始通道上,被用于预测后续组。后续通道中包含较少信息,并且较少用于预测后续组。因此可以将稍后的编码通道合并成更大的组来减少跨组预测,从而加快速度。
堆叠残差块
快速解码预览缩略图
实验结果
Cheng2020:Learned Image Compression With Discretized Gaussian Mixture Likelihoods and Attention Modules,复合熵模型、残差连接实现attention。