CAM：Class Activation Mapping 类激活映射

最新推荐文章于 2024-04-16 22:39:44 发布

STUffT

最新推荐文章于 2024-04-16 22:39:44 发布

阅读量1.1k

点赞数 1

分类专栏：读书文章标签：深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38869560/article/details/128341311

版权

读书专栏收录该内容

7 篇文章 0 订阅

订阅专栏

CAM

CAM

CAM

同济子豪兄-——CAM可解释性分析-算法讲解

Learning Deep Features for Discriminative Localization, CVPR2016

贡献：

奠定了可解释分析、显著性分析的基石

在这里插入图片描述

类别激活热力图可视化工具介绍

同一张图像，根据不同类别绘制不同的热力图

在这里插入图片描述

潜在的注意力机制
弱监督学习（图像分类模型 -> 完成定位）

1. 引言和相关工作

卷积神经网络中卷积单元充当目标检测器。但使用全连接层分类时，这种显著定位物体的能力丧失。
NIN 提出了 GAP (全局平均池化），其优势不仅体现在正则化，更关键的在于，它能保持网络的定位能力到最后一层。
GAM 可用于弱监督目标定位。

两篇多实例学习弱监督目标定位
“R. G. Cinbis, J. Verbeek, and C. Schmid. Weakly supervised object localization with multi-fold multiple instance learning. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2015. 1, 2”
“P. O. Pinheiro and R. Collobert. From image-level to pixellevel labeling with convolutional networks. 2015. 1, 2”

2. Class Activation Mapping 类激活映射

在这里插入图片描述

分析：

类别 c 的线性分类 $l o g i t$ 分数：
$S_c = \sum_k \omega_k^c \sum_{x,y} f_k(x,y) = \sum_{x,y}\sum_k \omega_k^c f_k(x,y)$

其中， $f_k(x,y)$ 表示最后一层卷积层的单元 k 在空间网格 $(x, y)$ 处的激活。之后，对单元 k ，经过GAP全局平均池化得到 $F_k = \sum_{x,y} f_k(x,y)$ 。对于类别 c ，输入经过 $so f t ma x$ ， $w_k^c$ 表明类别 c 对单元 k 重要性的权重。

类别 c 的类别概率映射 $M_c$ ：
$M_c(x,y) = \sum_k \omega_k^c f_k(x,y)$

因此， $S_c = \sum_{x,y} M_c(x,y)$ , 其中 $M_c(x,y)$ 表明在空间网格 $(x, y)$ 处对将图片分为 c 类的激活的重要性。

每个特征图 (feature map) 的通道 (channel) 代表了一个卷积核从图像中提取出的一类视觉特征。 $w_c$ 权重间接反映了该特征对类别 c 的重要程度。接着通过上采样，将 14x14 的特征图缩放到原输入图像尺寸。

GAP vs GMP：

average：关键区域范围内的特征都有影响
max ：非最大值的特征怎么变化都没用（无梯度）

分类性能接近，定位性能不同

讨论：

全卷积神经网络？为什么不用池化？
池化（Max、Mean）作用：
- 减少计算量
- 防止过拟合
- 平移不变性

池化（下采样）引入了平移不变性，也意味着丢失了长宽方向的位置信息。因此，在CAM热力图中，不使用带池化的卷积神经网络。

全局平局池化(GAP)？

全局平均池化（GAP）取代了全连接层，减少了参数量、防止过拟合。
而且每个GAP平均值，间接代表了卷积层最后一层输出的每个channel。
CAM算法中，必须有GAP层，否则无法计算每个channel的权重。[缺点]

在这里插入图片描述

[注] NIN 中提出了 GAP、1x1卷积。
在这里插入图片描述

3. 实验：Localization （定位竞赛）

Localization ：定位竞赛，图像中有一个物体需要分类 + 画一个框。

方法：用 GAP 代替全连接层 $\longrightarrow$ 重新训练模型
下采样次数越少，最后一层卷积层输出的 feature map 越大，空间信息丢失越少，定位性能越好。

4. CAM算法缺点：

必须有GAP层，否则得修改模型结构后重新训练
只能分析最后一层卷积层输出，无法分析中间层

改进工作：

Grad-CAM

不需要GAP层
可以分析中间层

SqueezeNet（轻量化网络）

最后一层卷积层直接输出对于类别数的channel数特征图
在这里插入图片描述

5. 显著性分析的意义

1.工业应用

machine learning
- 解决工业中的问题：如参数设置
machine teaching
- 通过可视化，告诉人们需要关注的位置，教会人们学习

AI 教学

论文：Making a Bird AI Expert Work for You and Me
教会人们利用图像的不同种类的鸟的哪些特征去区分不同的鸟

参考资料：

在这里插入图片描述

思考题：

在这里插入图片描述

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
CAM：Class Activation Mapping 类激活映射

介绍CAM(类激活映射），一项关于深度学习可视化的奠基之作。如何通过 GAP 全局平局池化实现类激活可视化。
复制链接

扫一扫

专栏目录

STUffT CSDN认证博客专家 CSDN认证企业博客

码龄7年

52: 原创

31万+: 周排名

17万+: 总排名

3万+: 访问

: 等级

576: 积分

37: 粉丝

22: 获赞

11: 评论

87: 收藏

私信

关注

热门文章

分类专栏

最新评论

DataWhale 机器学习夏令营第二期——AI量化模型预测挑战赛学习记录
STUffT: 对，要对每个预测任务分别训练一个模型。每个股票也可以分开训练。
DataWhale 机器学习夏令营第二期——AI量化模型预测挑战赛学习记录
s472688661k: 你好，这个比赛我看到其实是有10个股票以及每个股票有5个预测任务，所以是不是应该每个股票每个任务单独训练比较好？
DataWhale 机器学习夏令营第二期——AI量化模型预测挑战赛学习记录
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/616967842。
Pandas 数据可视化
m0_71334485: 很不错的内容，我佬这篇文章结构清晰，具有条理性可以借鉴并学习和落地，内容丰富图文并茂，认真看完收获很大，感谢大佬分享
机器学习模型搭建与评估
EmotionFlying: 机器学习模型搭建与评估，写的真好，学到了。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。