深度学习图像压缩_2-论文：Learning Convolutional Networks for Content-weighted Image Compression

最新推荐文章于 2024-01-09 01:20:49 发布

heweiqiran

最新推荐文章于 2024-01-09 01:20:49 发布

阅读量2.2k

点赞数 2

分类专栏：图像压缩视频编码深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/heweiqiran/article/details/102576092

版权

文章的创新点是在量化中加入了Importance Map，让模型自适应地选择重要的区域，整体结构为：
在这里插入图片描述
在编码器的输出端有两个分支。一个分支类似传统的自编码器，用于输出特征，并量化和解码。另一个分支作用是产生一个Importance Map，进而产生一个mask，对特征进行更好地量化。

1、二值化量化

对于编码器输出的特征，首先进行二值化，对每个值都量化为0或1，得到一个形状为HxWxC的特征图。为了保证反向传播中的可导，在反向传播使用线性模型代替二值化，公式可以查阅论文或者博客。

2、Importance Map

对于形状为HxWxC二值特征矩阵，实际上可以理解为特征图有HxW个点，每个点用C位二进制表示。实际上，更合理的方式是，根据每个点重要程度的不同，使用不同位的二进制数来表示。Importance Map可以理解为是实现这个功能，对于重要的点保留更多的位，不重要的点使用更少的位。
对Importance Map进行可视化，可以发现在边缘区域需要保留更多的位，这与经验一致。
在这里插入图片描述
Importa

最低0.47元/天解锁文章

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。