2015
SSP-Net:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
Introduce
-
R-CNN为什么检测速度这么慢?
-
对图像提完Region Proposal(2000个左右)之后将每个Proposal当成一张图像进行后续处理(CNN提特征+SVM分类)
实际上对一张图像进行了2000次提特征和分类的过程! -
将Region Proposal在原图的位置映射到卷积层特征图上,这样对于一张图像我们只需要提一次卷积层特征,然后将每个Region Proposal的卷积层特征输入到全连接层做后续操作.
-
但是全连接层输入必须是固定的长度
CNN 需要固定输入图像的尺寸- 卷积层对于图像是没有尺寸限制要求的,全连接层需要固定输入向量的维数
- 全连接层输入向量的维数对应全连接层的神经元个数,所以如果输入向量的维数不固定,那么全连接的权值参数个数也是不固定的,这样网络就是变化的,而在卷积层中,我们需要学习的kernal filter 参数个数是固定的。
-
-
SPP为的就是解决上述的问题,做到的效果为:不管输入的图片是什么尺度,都能够正确的传入网络.
-
思路:CNN的卷积层是可以处理任意尺度的输入的,只是在全连接层处有限制尺度——换句话说,如果找到一个方法,在全连接层之前将其输入限制到等长,那么就解决了这个问题.
-
在
-