Faster RCNN总览

最新推荐文章于 2022-07-08 21:36:49 发布

丁天牛

最新推荐文章于 2022-07-08 21:36:49 发布

阅读量352

点赞数

分类专栏： Pytorch：Faster RCNN

本文链接：https://blog.csdn.net/weixin_42782833/article/details/119386206

版权

Pytorch：Faster RCNN 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

如下图所示为Faster RCNN算法的基本流程，从功能模块来讲，主要包括四个部分：特征提取网络、RPN模块、RoI Pooling(Region of Interest)模块与RCNN模块，虚线表示仅仅在训练时有的步骤。Faster RCNN延续了RCNN系列的思想，即先进行感兴趣区域RoI的生成，然后再把生成的区域分类，最后完成物体的检测，这里的RoI使用的即是RPN模块，区域分类是RCNN网络
特征提取网络Backbone：输入图像首先经过Backbone得到特征图，在此以VGGNet为例，假设输入图像的1维度为3×600×800，由于VGGNet包含4个Pooling层(物体检测使用VGGNet时，通常不适用第5个Pooling层)，下采样率为16，因此输出的feature map的维度为512×37×50

RPN模块：
区域生成模块，如下图的中间部分，其作用是生成较好的建议框，即Proposal，这用到了强先验的Anchor。RPN包含5个子模块：

Anchor生成：RPN对feature map上的每一个点都对应了9个Anchors，这9个Anchors大小宽高不同，对应到原图基本可以覆盖所有可能出现的物体。因此，有了数量庞大的Anchor，RPN接下下来的工作就是从中筛选，并调整出更好的位置，得到Proposal
RPN卷积网络：与上面的Anchor对应，由于feature map上每个点对应了9个Anchors，因此可以利用1×1的卷积在feature map上得到每一个Anchor的预测得分与预测偏移值
计算RPN loss：这一步只在训练中，将所有的Anchors与标签进行匹配，匹配程度较好的Anchors赋予整样本，较差的赋予负样本，得到分类与偏置的真值，与第二步中的预测得分与预测偏移值进行loss的计算
生成Proposal：利用第二步中每一个Anchor预测的得分与偏移量，可以进一步得到一组较好的Porposal，送到后续网络中
筛选Proposal得到RoI：在训练时，由于Proposal数量还是太多(默认是2000)，需要进一步筛选Proposal得到RoI(默认数量是256)。在测试阶段，则不需要此模块，Proposal可以直接作为RoI，默认数量为300

RoI Pooling模块：
这部分承上启下，接收卷积网络提取的feature map和RPN的RoI，输出送到RCNN网络中。由于RCNN模块使用了全连接网络，要求特征维度固定，而每一个RoI对应的特征大小各不相同，无法送入到全连接网络中，因此RoI Pooling将RoI的特征池化到固定的维度，方便送到全连接层中

RCNN模块：
将RoI Pooling得到的特征输入全连接网络，预测每一个RoI的分类，并预测偏移量以精修边框位置，并计算损失，完成整个Faster RCNN过程。主要包含3个部分：

RCNN全连接网络：将得到的固定维度的RoI特征接到全连接网络中，输出为RCNN部分的预测得分与预测回归偏移量
计算RCNN的真值：对于筛选出的RoI，需要确定是正样本还是负样本，同时计算与对应真实物体的偏移量。在实际实现时，为实现方便，这一步往往与RPN最后筛选RoI那一步放到一起
RCNN loss：通过RCNN的预测值与RoI部分的真值，计算分类与回归loss

从整个过程可以看出，Faster RCNN是一个两阶的算法，即RPN与RCNN，这两步都需要计算损失，只不过前者还需要为后者提供较好的感兴趣区域。

丁天牛

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Faster RCNN总览

如下图所示为Faster RCNN算法的基本流程，从功能模块来讲，主要包括四个部分：特征提取网络、RPN模块、RoI Pooling(Region of Interest)模块与RCNN模块，虚线表示仅仅在训练时有的步骤。Faster RCNN延续了RCNN系列的思想，即先进行感兴趣区域RoI的生成，然后再把生成的区域分类，最后完成物体的检测，这里的RoI使用的即是RPN模块，区域分类是RCNN网络特征提取网络Backbone：输入图像首先经过Backbone得到特征图，在此以VGGNet为例，假设输入图
复制链接

扫一扫