【目标检测系列：四】SSP-Net论文阅读解析

最新推荐文章于 2022-05-06 18:30:33 发布

鹿鹿最可爱

最新推荐文章于 2022-05-06 18:30:33 发布

阅读量1k

点赞数 1

分类专栏：目标检测文章标签： SSP-Net：Spatial Pyramid Pooling in object detection SSP-Net RCNN

本文链接：https://blog.csdn.net/qq_31622015/article/details/93378071

版权

2015
SSP-Net：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

R-CNN为什么检测速度这么慢？
- 对图像提完Region Proposal（2000个左右）之后将每个Proposal当成一张图像进行后续处理(CNN提特征+SVM分类)
  实际上对一张图像进行了2000次提特征和分类的过程！
- 将Region Proposal在原图的位置映射到卷积层特征图上，这样对于一张图像我们只需要提一次卷积层特征，然后将每个Region Proposal的卷积层特征输入到全连接层做后续操作.
- 但是全连接层输入必须是固定的长度
  CNN 需要固定输入图像的尺寸
  - 卷积层对于图像是没有尺寸限制要求的，全连接层需要固定输入向量的维数
  - 全连接层输入向量的维数对应全连接层的神经元个数，所以如果输入向量的维数不固定，那么全连接的权值参数个数也是不固定的，这样网络就是变化的，而在卷积层中，我们需要学习的kernal filter 参数个数是固定的。
SPP为的就是解决上述的问题，做到的效果为：不管输入的图片是什么尺度，都能够正确的传入网络.
- 思路：CNN的卷积层是可以处理任意尺度的输入的，只是在全连接层处有限制尺度——换句话说，如果找到一个方法，在全连接层之前将其输入限制到等长，那么就解决了这个问题.
- 在

关注