目标检测-Faster RCNN论文总结（RPN）

最新推荐文章于 2022-11-27 20:18:23 发布

AI研习图书馆

最新推荐文章于 2022-11-27 20:18:23 发布

阅读量847

点赞数 4

分类专栏：算法学习文章标签： RPN faster rcnn

本文链接：https://blog.csdn.net/weixin_44222014/article/details/103275116

版权

Faster R-CNN是Ross Girshick提出的高效目标检测模型，它通过区域建议网络（RPN）取代传统Selective Search，显著提升了检测速度。RPN包括特征提取、RPN分类、Proposal Layer和ROI Pooling四个关键步骤，其中RPN分类确定前景和背景，bounding box regression获取目标大致位置。经过训练和ROI Pooling，模型能精确检测目标。

摘要由CSDN通过智能技术生成

个人微信公众号：AI研习图书馆，欢迎关注~

深度学习知识及资源分享，学习交流，共同进步~

1. 引言

Faster R-CNN是大神Ross Girshick 2015年提出的一个很经典的检测结构，它将传统的Selective Search提取目标的方法替换成网络训练来实现，使得全流程的检测、分类速度大幅提升。

图1是Faster R-CNN的基本结构，由以下4个部分构成：
在这里插入图片描述
1、特征提取部分：用一串卷积+pooling从原图中提取出feature map；

2、RPN部分：这部分是Faster R-CNN全新提出的结构，作用是通过网络训练的方式从feature map中获取目标的大致位置；

3、Proposal Layer部分：利用RPN获得的大致位置，继续训练，获得更精确的位置；

4、ROI Pooling部分：利用前面获取到的精确位置，从feature map中抠出要用于分类的目标，并pooling成固定长度的数据；

2. 特征提取部分

特征提取部分是输入图片和feature map间的那一串卷积+pooling，这部分和普通的CNN网络中特征提取结构没有区别，可以用VGG、ResNet、Inception等各种常见的结构实现(只使用全连接层之前的部分)，这部分不再详述。

3. RPN部分

目标识别有两个过程：首先你要知道目标在哪里，要从图片中找出要识别的前景，然后才是拿前景去分类。

在Faster R-CNN提出之前常用的提取前景(本文称为提取proposal)的方法是Selective Search，简称SS法，通过比较相邻区域的相似度来把相似的区域合并到一起，反复这个过程，最终就得到目标区域，这种方法相当耗时以至于提取proposal的过程比分类的过程还要慢，完全达不到实时的目的。

到了Faster R-CNN时，作者就想出把提取proposal的过程也通过网络训练来完成，部分网络还可以和分类过程共用，新的方法称为Reginal Proposal Network(RPN)，速度大大提升。