【目标检测算法】Faster R-CNN（详解）

最新推荐文章于 2025-03-16 13:08:28 发布

chaser&upper

最新推荐文章于 2025-03-16 13:08:28 发布

阅读量6.3k

点赞数 5

分类专栏： # 计算机视觉文章标签：人工智能深度学习计算机视觉

本文链接：https://blog.csdn.net/qq_46092061/article/details/119699680

版权

计算机视觉专栏收录该内容

31 篇文章

订阅专栏

Faster R-CNN是目标检测的重要算法，它引入了Region Proposal Network (RPN)替代选择性搜索，实现端到端训练。RPN通过3×3卷积在特征图上生成anchors，然后通过softmax分类和bounding box regression挑选并修正候选区域。训练时，RPN和Fast R-CNN部分分别进行，优化分类和回归损失。相比R-CNN和Fast R-CNN，Faster R-CNN显著提高了检测速度，但在小目标检测和参数量上仍有改进空间。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

学习目标

目标
- 了解Faster R-CNN的特点
- 知道RPN的原理以及作用

【目标检测算法】Fast R-CNN（详解）

在Fast R-CNN还存在着瓶颈问题：Selective Search（选择性搜索）。要找出所有的候选框，那我们有没有一个更加高效的方法来求出这些候选框呢？

1. Faster R-CNN

在Faster R-CNN中加入一个提取边缘的神经网络，也就说找候选框的工作也交给神经网络来做了。这样，目标检测的四个基本步骤（候选区域生成，特征提取，分类，位置精修）终于被统一到一个深度网络框架之内。

在这里插入图片描述

Faster R-CNN可以简单地看成是区域生成网络+Fast R-CNN的模型，用区域生成网络（Region Proposal Network，简称RPN）来代替Fast R-CNN中的选择性搜索方法，结构如下：

在这里插入图片描述

1、首先向CNN网络(VGG-16)输入图片,Faster RCNN使用一组基础的conv+relu+pooling层提取feature map。该feature map被共享用于后续RPN层和全连接层。
2、Region Proposal Networks。RPN网络用于生成region proposals,faster rcnn中称之为anchors
- 通过softmax判断anchors属于foreground或者background
- 再利用bounding box regression修正anchors获得精确的proposals，输出其Top-N(默认为300)的区域给RoI pooling
生成anchors -> softmax分类器提取fg anchors -> bbox reg回归fg anchors -> Proposal Layer生成proposals
3、后续就是Fast RCNN操作

在这里插入图片描述

2. RPN原理

RPN网络的主要作用是得出比较准确的候选区域。整个过程分为两步

用n×n(默认3×3=9)的大小窗口去扫描特征图，每个滑窗位置映射到一个低维的向量(默认256维)，
并为每个滑窗位置考虑k种(在论文设计中k=9)可能的参考窗口(论文中称为anchors)

2.1 anchors

在这里插入图片描述

3*3卷积核的中心点对应原图上的位置，将该点作为anchor的中心点，在原图中框出多尺度、多种长宽比的anchors,三种尺度{ 128，256，512 }，三种长宽比{1:1，1:2，2:1}，每个特征图中的像素点有9中框

举个例子：

在这里插入图片描述

3. Faster RCNN训练

3.1 Faster R-CNN的训练

Faster R-CNN的训练分为两部分，即两个网络的训练。

RPN训练：
- 目的：从众多的候选区域中提取出score较高的，并且经过regression调整的候选区域
Fast RCNN部分的训练：
- Fast R-CNN classification (over classes) ：所有类别分类 N+1，得到候选区域的每个类别概率
- Fast R-CNN regression (bbox regression)：得到更好的位置

在这里插入图片描述

3.2 候选区域的训练

训练样本anchor标记
- 1.每个ground-truth box有着最高的IoU的anchor标记为正样本
- 2.剩下的anchor/anchors与任何ground-truth box的IoU大于0.7记为正样本，IoU小于0.3，记为负样本
- 3.剩下的样本全部忽略
- 正负样本比例为1：3

在这里插入图片描述

训练损失
- RPN classification (anchor good / bad) ，二分类，是否有物体，是、否
- RPN regression (anchor -> proposal) ，回归
- 注：这里使用的损失函数和Fast R-CNN内的损失函数原理类似，同时最小化两种代价

候选区域的训练是为了让得出来的正确的候选区域，并且候选区域经过了回归微调。在这基础之上做Fast RCNN训练是得到特征向量做分类预测和回归预测。