【论文阅读笔记】Visualizing and Understanding Convolutional Networks

本文是发表在ECCV2014年的论文,主要贡献如下:

1、提出一种可视化CNN隐层特征的方法,通过引入一个和CNN计算过程相逆的decovnet来实现。其中convolution ,RELU操作和CNN一直,max-pooling由于运算不可逆,在CNN中引入了switch变量记录max-pooling中每一步的最大值,在un-pooling时在最大值位置用原最大值填充,其他位置用0填充。

        

2、文章对特征可视化得出以下结论:

(1) 底层特征在迭代次数比较少时就能收敛,高层需要的迭代次数比较多;(2)CNN学习到的特征对于图片平移和缩放具有不变性,但是对于旋转没有不变性。(3)高层提取到的特征更加宏观和具有更多的不变性。(4)深层网络比浅层网络识别效果更好


3.可视化指导网络结构调整

通过对CNN可视化发现,第一层特征只对于高频和低频信息有了收敛,但是对于中层信息却还没有收敛,在第二层出现了混叠失真,通过将第一层filter size和stride减小解决了问题,体现出可视化对网络结构设计的指导性作用。

 

4、对图片部分遮挡的敏感性

文中使用灰色矩形区域遮挡图片部分位置,分析发现如果遮挡部分涉及图片主要特征响应部分,CNN效果会很差。


5、关联分析

作者认为深度结构隐形地学习到不同图像中一些特定结构的关联性,如人脸的眼睛和鼻子,通过遮挡不同图像的相同结构,然后计算学习的特征与没有遮挡之前学习到的特征之间的差,然后这些差的Hamming距离Δ,当Δ越小时,说明了网络还是学习到了一定的结构关联性。



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值