上次我们介绍了R-CNN算法【目标检测算法系列】一、R-CNN算法
这次介绍下SPP-Net算法
SPP-Net算法是在R-CNN的基础上做了相关改进
我们知道,R-CNN算法有几个缺点:
1. 由于CNN网络对输入图像尺寸的固定,所以对于每张图片生成的2000个候选区域,需要进行缩放、扭曲等操作来resize到CNN网络所要求的输入尺寸(224*224),这样就会导致一些特征的丢失,改变,从而影响精确度
2. R-CNN算法中,在通过CNN网络进行特征提取时,需要对每张图片的2000个候选区域分别处理,而这些候选区域中,是有很多重复部分的,所以会导致有很多重复运算,严重影响了RCNN检测的速度
SPP-Net针对RCNN的上述两个问题做了对应改进,从而提高了模型的精度和速度
一、CNN网络中对输入尺寸的固定问题
我们知道,在RCNN时,需要对输入的候选框的尺寸固定到224*224,为什么需要限制呢?
深层卷积网络中包含两个大的模块,一个是卷积模块,一个是全连接模块,对于卷积模块,其实并不需要限制图像输入尺寸,因为对于卷积模块中的所有filter来说,都是在与图像进行局部卷积操作,输入图像的不同尺寸,并不会影响filter的尺寸和个数,所以卷积层并不会限制图像尺寸,只是不同尺寸的图像,最后通过卷积模块后,输出的feat