一、这篇论文解决什么问题
- 模型为什么表现得好(内在原理)
- 模型怎么样改进(可解释地、可控地)
以前方法的局限性:
- 只可以对第一层特征进行可视化,而对高层特征束手无策
- 无法解释每一层的不变性(从不同的图中学到相同的特征)
本文的核心技术:Deconvolutional Network (deconvnet)
本文可以做到:解释训练集中的哪些pattern可以激活相应的feature map
二、模型基础结构及deconvnet技术
模型基础结构:比较经典的CNN分类器结构
deconvnet技术:运用这种技术如何研究一个模型
- 定目标:我们要研究哪一层的feature map,就将其输入到deconvnet进行一系列的操作
- 输入原始图像,正向计算要研究的那一层的feature map,挑出我们要研究的feature map
- 把除了这个feature map之外的feature map都设置为0,把这些feature map都输入到deconvnet中
- deconvnet-unpooling:max pooling在正向计算的时候,就记下来max的位置,在unpooling时,原来的位置仍要对