rpn产生proposals_RPN在RCNN上的应用——Faster RCNN

最新推荐文章于 2022-05-27 20:57:24 发布

weixin_39648297

最新推荐文章于 2022-05-27 20:57:24 发布

阅读量96

点赞数

文章标签： rpn产生proposals

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39648297/article/details/111803605

版权

本文介绍了Faster RCNN的工作原理，重点解析了Region Proposal Network (RPN)如何生成建议窗口。RPN通过共享卷积层与目标检测网络，结合Anchor box和NMS实现高效的目标提议生成。ROI Pooling、全连接层等步骤用于进一步的特征提取和分类。

摘要由CSDN通过智能技术生成

Faster-RCNN

简介

主要贡献使用RPN(Region Proposal Network)产生建议窗口

产生建议窗口的CNN和目标检测的CNN共享

基本原理

整体结构

卷积层。跟Fast RCNN差不多。

RPN层。

主要用于生成Region Proposals，首先生成一堆Anchor box，生成两个分支，其中一个分支对其reshape后用softmax判断anchors属于前景还是背景(一个二分类)；另一个分支bbox regression修正anchor box，形成较精确的proposal。roi pooling层。

输入为feature map和proposal，得到固定大小的proposal feature map，送入全连接层。

特征提取

对于任意大小的图片，padding成固定尺寸，如上图M*N。卷积层：size=3，pad=1，stride=1；feature map和原图尺寸一样。

ReLU层

pooling层：size=2，stride=2；池化后尺寸减半。

经过CNN后feature map变为原来的1/16。

RPN(Region Proposal Network)RPN整体框架

一、pn_conv/3*3和rpn_conv/3*3

得到feature map后进入RPN层，rpn_conv/3*3和rpn_conv/3*3是3*3的卷积，随后进入rpn_cls_score和rpn_bbox_pred均为1*1的全卷积。

3*3的卷积不改变feature map大小，仍是60*40*512。

全卷积实际上是将不同channel进行线性组合，从而升维或降维。

二、 rpn_data

这一层主要是生成anchor box，并和GT对比。生成Anchor

所谓Anchor即region proposal，由(x1,y1,x2,y2)表示，分别代表左上角和右下角坐标。尺寸的3种scale with box areas分别为{128*128,256*256,512*512}，缩放的3种aspect ratios分别为{1:1,2:1,1:2}，一共组合成9种矩形框。对于60*40大小的特征图，共生成60*40*9个anchor box。

当然，这些anchor box存在很多重叠和超边界情况，所以需要对所有的anchor进行过滤和标记。

标记anchor，对应分类任务去除超过原图边界的anchor box。

如果anchor box和GT的IoU最大，则标记为正样本，label=1

如果anchor box和GT的IoU>0.7，则标记为正样本，label=1

如果anchor box和GT的IoU<0.3，则标记为负样本，label=0

余下的样本均丢弃，label=-1

结果返还到rpn_cls_score_reshape。

偏移量，对应定位任务

即计算anchor box和GT之间的偏移量，不断学习减小。

记录四个回归值，返还到rpn_bbox_pred。

三、 rpn_loss_cls、rpn_loss_bbox、rpn_cls_prob

rpn_loss_cls和rpn_loss_bbox与Fast RCNN相同，这里不赘述。

rpn_bbox_pred是bbox的预测值(实际上是以前算的偏移值)

四、proposal

这一步主要是用NMS进一步矫正region proposal。NMS在RCNN中已经介绍过了，这里不再重复。简单来说就是去重的过程。

ROI Pooling

输入为RPN层产生的region proposal和VGG提取的feature map。

由于生成region proposal时是以原图为参考的，并不能直接迁移到feature map上。将坐标值缩小16倍后，才能建立到feature map上的映射。

将feature map的映射区域划分为7*7的区域，每个区域进行max 破欧玲，生成7*7的feature map。

FC层

softmax和cls_prob计算物体的类别。

bbox_pred学习偏移量，回归出更精准的边框。

我的博客：目标检测--Faster RCNN原理blog.csdn.net

reference：faster-rcnn原理介绍_人工智能_Lin_xiaoyi的博客-CSDN博客blog.csdn.netFaster RCNN 学习笔记www.cnblogs.com

【欢迎大家加入人工智能圈参与交流】人工智能学习圈 - 知乎www.zhihu.com

weixin_39648297

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
rpn产生proposals_RPN在RCNN上的应用——Faster RCNN

Faster-RCNN简介主要贡献使用RPN(Region Proposal Network)产生建议窗口产生建议窗口的CNN和目标检测的CNN共享基本原理整体结构卷积层。跟Fast RCNN差不多。RPN层。主要用于生成Region Proposals，首先生成一堆Anchor box，生成两个分支，其中一个分支对其reshape后用softmax判断anchors属于前景还是背景(一个二分类)...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。