Faster R-CNN 关于RPN的详解

最新推荐文章于 2023-05-25 15:19:09 发布

fine_0007

最新推荐文章于 2023-05-25 15:19:09 发布

阅读量885

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fine_0007/article/details/83187844

版权

Faster R-CNN是一种检测算法，与之前提出的算法差异较大的地方在于RPN的提出，RPN的作用是在图像上提取出可能存在物体的矩形区域并给出关于存在目标可能性的打分，给定后的区域将用于分类。

RPN的输入可以为任意尺寸的图片，经过网络的计算后，将输出5个变量，其中四个是预测目标所在位置矩形的坐标，包括中心点坐标和矩形的长宽，第五个变量是对输出矩形框的打分，打分越高矩形框的置信度越高。

RPN的工作过程是将图片输入后，利用卷积网络对图片的特征进行提取并得到一个feature map，在feature map上可以采用滑窗，每一个滑窗都将映射一部分图片的特征，特征输入至两全连接层，分别输出bbox回归和bbox分类，在原论文中特征映射进入全连接层之前，先采用3*3卷积预处理（在输入图片较大的前提下）。

对于每个滑窗的所在位置，同时预测多个建议（k个），回归层输出4k个坐标，分类层输出2k个分数（是否是目标，或可采用softmax实现，具体实现待定），每个中心点存在33个anchor（尺寸数比例数），分类层的输出最终将整合为一个值，其中回归层输出的坐标是来自原图的坐标。

RPN的feature map和原图之间存在着平移不变性，feature map与原图可以通过线性变换直接对应，RPN 是一种独特的多尺寸定位方法，提升计算效率，共享卷积层。

对于训练RPN，每个anchor分配一个双值label（是否是一个目标），两类正标签：具备与真值框（ground truth）的最大I

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。