Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition(SPP-NET)总结

网络总结

  1. spatial pyramid pooling网络可以适应任何大小的图片,而R-CNN就得固定大小了,要经过一些crop,或者warp的操作(我才知道这中操作是用来固定大小的),但是或导致图片变形.

  2. SPP-net是将整张图片送入卷积网络中,在最后的卷积层后面,开始提取不同的子图(暂且这么称呼,反正就是在截取子图)。然后加入了spatial pyramid pooling layer(空间金字塔池化层,好玄妙的名字!),使得不同尺寸的图片都会得到一个同样的输出。空间金字塔池化层
      之所以上面可以这么干(先卷积,后切子图)是因为:输入图片的局部位置的特征反应在特征图上也是在相同位置。比如一只猫在图片的左上角。那么这张图片的特征图,猫的特征也位于特征图的左上角。
      R-CNN切子图的位置位于卷积之前,因而需要对大量的子图进行卷积,很浪费时间,下面这张图就画的很到位,第一行是R-CNN,第二行是SPP-NET. 在这里插入图片描述

参考链接

https://blog.csdn.net/tinyzhao/article/details/53717136
https://blog.csdn.net/v1_vivian/article/details/73275259

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值