CAM——类激活图
背景
在使用卷积神经网络处理图像分类问题的时候,我们往往只得到最后的分类结果,但是CNN中间的处理过程是一个黑盒子,我们不清楚在中间发生了什么,那么通过CAM(Class Activation Mapping)可以将分类的输出映射回原图上,告诉我们是图像上的哪一部分对于最后的分类结果影响很大。
CAM
这里引用了原论文中给出的效果图,左边的图像被成功分类为刷牙,右边的图像则被分类成为砍树,在第二行给出了神经网络是根据图像上的那一部分完成的分类,越红的地方表示对于最后的分类影响越大。
CAM原理
以原文中的图片为例,对CAM进行解释:
CNN的操作可以看做是滤波器对图片进行特征提取,我们可以大胆直接的得出结论,被一层层卷积核提取后,基本就是卷积核判断是重要的信息,其值越大,特征越明显,得到卷积的关注度就越高。
一个深层的卷积神经网络,通过层层卷积操作,提取出语义信息和空间信息,我们一直都很希望可以打破深度神经网络的黑盒,可以溯源特征提取的过程,甚至可