SPP:Spatial Pyramid Pooling(空间金字塔池化),是何凯明大神设计的。
SPP网络针对RCNN网络修改了一些弊端:
1、RCNN提取的候选区域需要将其缩放至统一的大小,是因为CNN中存在全连接层,而全连接层需要固定输入和输出大小,这样本来图片中的有些内容可能就会失去信息,针对这个问题SPP提出了在图像卷积之后全连接层之前加入SPP池化层,这样可以任意尺寸的输入图像大小,输出则固定给全连接层。简单地说就是CNN本来只能固定输入、固定输出,CNN加上SPP之后,就能实现任意输入,固定输出。
2、 RCNN网络是将原图先提取2000个候选区域,然后将这么多区域都送到CNN提取特征,SPP是直接只对原图做一次卷积运算,得到整张图的特征图,RCNN需要对每个区域做卷积,SPP只需要对整张图做一次卷积。
SPP也存在一些弊端:
1、训练步骤也多,也需要训练SVM分类器,需要额外的回归器,特征也保存在磁盘上。
这是我对SPP-Net网络的理解,如有错误,还请指正,希望能互相学习。