背景
Faster R-CNN对于object detection效果很好,但是对于detecting pedestrian效果一般
专门为pedestrian detection设计的RPN作为一个独立的pedestrian detector表现很好,但是在把这些生成的proposals送入Fast R-CNN分类器时表现很差
传统的pedestrian detectors大多是hand-crafted feature和deep convolutional features的混合方法
Faster R-CNN表现及改进:
处理小目标时,送入Fast R-CNN分类器的convolutional feature maps的分辨率太低,这与hand-crafted features可以得到更好的分辨率形成对比。为此,可以通过从较浅但分辨率较高的层pooling features,并用hole algorithm增加feature map的大小来解决这个问题。
pedestrian detection中的错误预测主要是由于hard background instances混淆造成的,这与object detection出现混淆的原因(多个类别)不同。为了解决hard negative examples,采用cascaded Boosted Forest(BF)的方法,可以有效的解决hard negative mining(bootstrapping)和sample re-weighting,以区分RPN的proposals。(即:用bootstrapping strategy挖掘hard negative examples)
创新
BF重新利用RPN的深度卷积特征,并在共享的高分辨率的卷积特征图上增加boosted forests。这个策略不仅降低了