论文:
Grad-CAM: Why did you say that? Visual Explanations from Deep Networks via Gradient-based Localization
链接:论文链接
0.CAM和Grad-CAM基于1个假设:
- 类别c获得的softmax分数yc,是最后1层卷积特征图A(可以包含多个通道)的全局均值池化后的线性组合。
1.原理
Grad-CAM是使用任何目标概念的梯度,流入最后一卷积层,生成1个粗略的定位图来显示和【预测区域】关联性更高的区域。
2.实现方式:
以上图的【猫】为例:
最后一层的特征图有:N个通道(每个通道用k表示)
1.求偏导数
计算最后一层softmax输出中【猫类】概率yc对最后一层