RCNN
RCNN主要步骤:
(1)生成候选框(select search)。在图像中确定2k个候选框,采用Felzenszwalbs‘s method、SLIC、quick shift等方法实现。
(2)将生成的候选框缩放至相同大小,输入CNN进行提取特征
(3)分类。对候选框中的特征进行判别,SVM
(4)回归。对某一特征的候选框,调整位置。
缺点:对生成的每个候选框都进行CNN特征提取,时间花费过多;候选框缩放,精度降低
SPPnet
SPP-Net是对rcnn的改进,spatial Pyramid Pooling,主要观点:
(1)共用特征卷积图
(2)空间金字塔池化,有效地解决了不同尺度的图片在全连接层输出不一致的问题。
RCNN存在的问题:
(1)RCNN通过对图像的裁剪crop或缩放warp,使得输入图片的信息缺失或变形,降低了图片识别的准确率。
(2)对每个RP进行卷积计算,算力过大。