Visualizing and Understanding Convolutional Networks论文总结

最新推荐文章于 2022-08-29 11:45:56 发布

SCS199411

最新推荐文章于 2022-08-29 11:45:56 发布

阅读量344

点赞数

分类专栏：深度学习文章标签： CNN 可视化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/scs199411/article/details/94456860

版权

深度学习专栏收录该内容

10 篇文章 1 订阅

订阅专栏

Visualizing and Understanding Convolutional Networks

CNN领域可视化理解的开山之作。

这篇文献告诉我们CNN的每一层到底学习到了什么特征，然后作者通过可视化进行调整网络，提高了精度。

网络结构

与AlexNet类似
在这里插入图片描述

通过反卷积实现可视化

unpooling：利用switches表格记录每个最大值的位置，在该位置填回最大数值，其余位置填0。
Relu：直接利用ReLU函数，仍然确保输出为非负数。
反卷积：利用相同卷积核的转置作为核，与输入做卷积运算。

反卷积
在这里插入图片描述
输入图像大小为4x4，卷积Kernel为3x3, 没有Padding,Stride为1, 则输出图像的大小为2x2。

输入矩阵可展开为16维向量，记作X，输出矩阵可展开为4维向量，记作Y，卷积运算可表示为

$Y = C X$

C其实就是如下的稀疏矩阵:
在这里插入图片描述
若输入图像大小2×2，则首先展开成(4,1)大小的向量，反卷积运算可表示为：

$X=C^T*Y$

可视化结果

在这里插入图片描述

结论：

1.层数越高，所提取的特征越抽象

Layer1和2 颜色、边缘、轮廓
Layer3 纹理特征
Layer4 类别之间的差异
Layer5 同类之间的差异

2.特征学习的过程

经过一定次数的迭代之后，底层特征趋于稳定，但更高层特征要更多次迭代才能收敛。
在这里插入图片描述

在训练网络的时候，不要着急看结果，看结果需要保证网络收敛。

3.特征不变性。

平移和尺度变化并不影响CNN的分类结果，但CNN无法对旋转产生良好的鲁棒性。
在这里插入图片描述

结构的选择

在这里插入图片描述

filter 11×11 strides 4 -> filter7×7 strides 2

遮挡测试

当关键区域发生遮挡时，分类器性能急剧下降。
在这里插入图片描述

相关性分析

解释物体部件之间的相关性，比如人脸中眼睛和鼻子的空间位置的关系。
在这里插入图片描述

实验

1.ImageNet 2012

14.8%的Top-5准确率，比当时公开的数据都要精确，且只用了12年的dataset。
在这里插入图片描述
最终发现删除6、7层全连接层，错误率只有轻微提升，删掉两层卷积层错误率也没有明显提升，但删除这四层之后，错误率急剧提升。

2.特征泛化能力

在不改变模型1~7层训练结果，只训练softmax层的情况下，又进行了Caltch-101、Caltch-256、PASCAL VOC 2012三个库的测试。
在这里插入图片描述

总结：

模型的深度很重要，虽然这也增加了过拟合的可能。
可适当精简层，特别是全连接层。
在扩充训练集的时候，调整图像角度是关键。
可以先进行其他数据记得预训练。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Visualizing and Understanding Convolutional Networks论文总结

Visualizing and Understanding Convolutional NetworksCNN领域可视化理解的开山之作。这篇文献告诉我们CNN的每一层到底学习到了什么特征，然后作者通过可视化进行调整网络，提高了精度。网络结构与AlexNet类似通过反卷积实现可视化unpooling：利用switches表格记录每个最大值的位置，在该位置填回最大数值，其余位置填0。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。