可视化卷积神经网络的过滤器_卷积神经网络可视化文献阅读

最新推荐文章于 2022-10-07 10:10:57 发布

weixin_39926040

最新推荐文章于 2022-10-07 10:10:57 发布

阅读量80

点赞数

文章标签：可视化卷积神经网络的过滤器

《Visualizing and Understanding Convolutional Networks》总结

1 Introduction

1.1 Related Work

2 Approach

2.1 Visualization with a Decovnet

本文用反卷积网络deconvnet来实现映射（将featuremap映射回输入像素空间）
deconvolution/上采样up-sampling/反卷积/转置卷积transposed conv是一样的
反卷积（转置卷积、反激活Relu，反池化）用于非监督学习
每层附加反卷积神经网络，提供返回图像像素连续路径
将输入给卷积神经网络→计算各层特征
检查convnet激活，将该层其他设置为0，并将特征映射作为输入传递到附加的deconvnent层，
依次反池化unpooling、反激活Rectification、反卷积Filtering重建所选激活层
- 反池化unpooling：最大池化是不可逆的，但是我们可以存储最大像素的位置（switch），反池化时即可还原，但不可避免会丢失非极大值像素的信息
- 反激活Rectification：仍然用Relu，正向Feature map因为Relu使用均为正，反向卷积时也用Relu确保都为正值
- 反卷积Filtering：使用转置后卷积核
重复直到达到输入像素空间
虽然池化时会丢失一部分信息，但重构得到的图和原始输入图依旧很像，亮暗轮廓体现出特定feature map反映的特征

3 Training Details

与前人不同（Krizhevsky's layer 3,4,5被紧密连接替代；layer1,2是检查了可视化后调整的）
数据集：模型在ImageNet 2012训练集上训练的，
数据预处理：每个RGB图像预处理是调整最小尺寸为256×256，减去每个像素平均值，
数据增强：使用10个大小为224×224的子图像（边缘、中心翻转或无翻转），
优化器、超参数：随机梯度下降更新参数用到大小为128的mini batch，学习率10-2，动量0.9。验证错误趋于停滞时，减小学习率。dropout用于全连接层6,7，速率为0.5，
正则化：所有权重初始化为10-2，偏差设置为0
卷积层每一个RMS值超过固定半径10-1的过滤器进行重新正则化。、
增加训练集大小（通过多尺度、翻转）
70个epoch后停止训练，花费12天

4 convnet Visualization

4.1 Architecture selection

4.2 Occlusion Sensitivity遮挡敏感性分析

4.3 Correspondence Analysis

深度学习模型没有显式定义图像中各部分的关系

越小说明第l层捕捉到个特征之间越相关

越深的层更加关注语义信息，而非

5Experiments

5.1 ImageNet 2012

5.2 Feature Generalization

5.3 Feature Analysis

关注