根据MIT的 Learning Deep Features for Discriminative Localization论文中的描述,在使用类响应图class activation mapping (CAM) 对比全局平均池化Global average pooling (GAP) vs 全局最大池化global max pooling (GMP):
类响应图示例:
图中高亮区域就是根据label的注意图高响应区域
具体得到的这个相应区的方法是
1) 训练主干网络得到特征图
2) 进行全局池化(图中用的GAP,也可以使用GMP)
3) 对全局池化的结果做全连接得到全连接参数 w
4) 把全连接参数作为权重对特征图进行加权求和 上图最下方的公式
根据对图像的研究发现,不同的类别的特征图相应区域不一样,原始的卷积网络具有一定的定位