之前介绍了R-CNN,Fast R-CNN,这是本系列的第三篇 Faster R-CNN
在上一篇介绍Fast R-CNN的blog中介绍了,Fast R-CNN 对整张图像提特征,再使用RoI Pooling根据proposal从全图的feature map中提取相同大小的特征。替代了R-CNN中上千次的前向运算,提高了模型的运行速度。但是,由于Fast R-CNN region proposal提取使用的selective search,消耗了整个目标检测的大量时间。于是Faster R-CNN应运而生。
Faster R-CNN
Faster R-CNN主要有两个贡献:
- 提出区域建议网络RPN,替代selective search快速生成proposal region
- 通过交替训练,使RPN和Fast-RCNN网络共享参数。
先来看看Faster R-CNN的结构
输入图像通过卷积神经网络提取特征得到feature map,然后这个feature map有两个branch,先说第一个branch送到Region Proposal Network(RPN)来生成提议区域,这样做使得生成提议区域的时间从2s缩减到10ms。
在前一篇Fast R-CNN中提到,用卷积神经网络对整张图像提取特征,然后再这些特征中使用RoI Pool