Faster-RCNN1主要是为了解决Fast-RCNN中region proposal的耗时问题。之前所用的selective search方法的耗时往往比检测本身的耗时还要长,因此本文提出了一种Region Proposal Network(RPN)用来获取region proposal,同时RPN与Fast-RCNN中的检测网络可以共享卷积层,提升检测速度。使得RCNN系列方法可以朝着实时目标检测迈进。
简单来说,Faster-RCNN是在Fast-RCNN的卷积层特征提取之后加了一个RPN用来获取region proposal(或者说是ROI),其他步骤基本不变,如下图2所示。
1 RPN介绍
RPN的输入为一幅任意大小的图像,输出是一个矩形边界框集合,以及每个边界框对应的类别概率。下图是其大概框架。
在得到最后一层卷积层的输出后,对其进行以下处理:
- 使用一个n × \times ×n的window在feature map上进行滑动(本文n=3)。每个window位置对应有k个anchors,每个anchor关联一个图