目标检测要求对目标进行精确定位,这增加了复杂度,会产生两个主要的挑战:
1. 大量候选的目标定位(proposals)需要被处理
2. 候选的proposals只提供了大致的目标定位,需要通过优化获得更加精确的定位
论文中,作者提出一种“单级训练算法”(single-stage training algorithm ),proposals分类与重新定位同时进行。
R-CNN的缺点:
1. 训练是多级的
2. 训练阶段,时间空间上消耗太大
3. 测试阶段,目标检测太慢
原因:R-CNN对每个proposal进行前向卷积,而没有共享计算
SPP nets
SPP nets通过共享计算对R-CNN进行加速。首先计算一整张输入image的conv feature map,然后通过共享的feature map提取feature vector,并以此对proposal进行分类。
用max-pooling对feature map提取proposal的feature(一个固定大小的输出),多个输出对应多种尺寸,然后送入SPP net。
缺点:
1. 训练也是多级的
2. 训