[深度学习]Object detection物体检测之SPPNet(3)

目录

1.论文的综述

2.Spatial Pyramid Pooling结构

3.Training the Network训练网络的细节

4.SPP-NET FOR OBJECT DETECTION


论文全称:《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》

论文地址:https://arxiv.org/pdf/1406.4729.pdf

论文一作是kaiming He,怎么到处都是你,真的强的不像话呀。

1.论文的综述

当下卷积神经网络的弊端是输入必须是fixed size统一大小,然而这么做是很不科学的,为了把图片送进我们训练好的网络我们必须crop或者warp,具体看下图。crop的坏处是使图像不完整,warp的坏处是使图像产生了几何畸变。这两种情况都会降低分类的准确率,并且统一的输入大小不符合现实生活中的实际情况,因为很多物体没有固定的长宽比,而照片也没有固定的像素。

所以作者就思考一种解决办法,他们分析其实传统卷积网络无非就是卷积部分加上全连接部分,卷积分部提取图像特征其实并非一定要统一的size,只是后面的全连接需要统一大小的feature,所以作者在卷积层和全连接层之间加入一个Spatial Pyramid Pooling空间金字塔池化,它的作用是使得大小不一致的feature变成固定大小的feature,来匹配全连接层。下面是传统方法和本论文方法的区别图:

那么SPPNet有什么特性使它特别适合CNN呢?

  1. SPP能够生成固定长度的输出,而不考虑输入大小,而在以前的深度网络中使用的滑动窗口池化却不能;
  2. SPP使用multi-level spatial bins多级空间箱,而e sliding window pooling滑动窗口池化只使用单个窗口大小。多级池已被证明是鲁棒的对象变形。
  3. 由于输入尺度的灵活性,SPP可以在可变尺度下提取特征。(这里第三点有点疑惑,论文里面这说的不明白)

无论是在testing还是training,可变输入都是允许的

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值