参考:http://xuyunkun.com/2018/10/07/CS231n Lecture 12 Visualizing and Understanding/
1. 第一层卷积权重的可视化
Alexnet中第一层是64个31111的卷积核,将经过第一层的图像组合成64个3通道的11*11的图像后,我们可以看到,第一层试图在寻找有向边,比如明暗线条,完全相反的颜色分割如绿色和粉色,蓝色和橙色。对于其他网络如resnet或者vgg也是相似的情况。
2. 最后一层特征向量的可视化
通常在分类的前一层是全连接层,如FC7,对于FC7的4096维特征我们用最近邻算法做聚类,结果表明,同一类别被聚为一类。之前直接对输入图像逐像素聚类,会把背景类似的图像聚为一类,原因是背景相比于前景可能像素量更大。
3. 中间层激活映射图
Conv5的特征向量为1281313,可以看作128个灰度图,大部分中间层特征图存在干扰,但是在该人脸检测的实验中,有一个突出的中间层特征,位置看起来跟人脸的位置很对应。
4. 遮挡实验
将一幅输入图像的某个部分遮挡,并且将遮挡区域设置为这幅图像的平均像素值,将图像输入神经网络,得到图像的预测值,将遮挡块依次划过每个位置,记录对应位置的预测概率,如果遮挡了某一部分导致了概率发生急剧变化,那么这部分可能对分类有较大影响。