关于深度图像压缩方法中的位可变问题的探讨

最新推荐文章于 2024-07-26 18:09:40 发布

凤舞九天cw

最新推荐文章于 2024-07-26 18:09:40 发布

阅读量800

点赞数 1

分类专栏：图像与视频压缩

本文链接：https://blog.csdn.net/qq_17464457/article/details/105349863

版权

图像与视频压缩专栏收录该内容

5 篇文章 9 订阅

订阅专栏

在基于深度自编码网络的图像压缩方法中，有一个关于位分配的问题，即对于人眼视觉更关注的区域分配更多的比特位，其他区域分配少一点的比特位，之前的深度学习图像压缩模型对于整个图像区域的内容都是位不变的分配方式，即对整个图像内容同等对待，都分配同样的比特位，但是[1]提出了重要性图(importance map)的模块用于指导内容的位可变分配，简单来说就是实现内容的自适应；除此之外，还有另一种由显著性图(salient map)实现的类似的方式，但又与重要性图不同，具体的方式如下：

方式一：重要性图(Importance Map)

重要性图是基于编码后的特征图(encoded_features)的信息而生成的一个单通道的特征图，宽和高与编码后的特征图相同，其中重要性图的一种网络结构如下图所示：

通常的ImportanceMapNet在得到y后是直接使用sigmoid函数，此处[2]增加了一个归一化的操作，使重要性图自适应于内容的分布。

获取了importance map后，有一个Extension的操作，这一操作是获取掩码mask，掩码的数据维度与编码后的特征图相同，Extension操作如下所示：

其中k代表通道，k=0,1,2...,C-1，i，j表示相应通道的空间位置， $m_{i,j,k}$ 表示掩码mask相应位置的值， $y_{i,j}$ 是importance map在空间位置i，j处的值；其中importance map的数值范围需要先映射至[0，k]，与通道数相关联；

由Extension变换后便得到掩码mask，mask再与encoded_features进行element-wise multiplication，即可得到masked_features，随后对masked_features进行量化，熵编码等处理；

方式二：显著性图(Salient Map)

与importance map不同的是，显著性图是由单独的显著性检测模型对输入图像处理得到单通道的显著性图，显著性图是一个二值化的图像。显著性图同样采用Extension的变换方式获取掩码mask，然后对encoded_features进行同样的操作，得到masked_features，但是显著性图mask处理的结果与importance map的有些不同；

以Kodak数据集的kodim15.png为例说明：