Faster RCNN及RoI pooling小结

最新推荐文章于 2022-03-30 07:02:19 发布

kgbkqLjm

最新推荐文章于 2022-03-30 07:02:19 发布

阅读量374

点赞数 1

分类专栏： Deep Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ljmiiianng/article/details/101193263

版权

Deep Learning 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

RoI： Region of interest也称作Region Proposal

指目标检测one-stage和two-stage差的那部分，具体是说现在img中找到所有可能的存在object的区域
后续再对这些区域进行判别识别存在目标object

对于不需要预生成RP的Detection算法而言，算法只需要完成三个任务：

1特征抽取
2分类
3定位回归
对于有预生成RP的Detection算法而言，算法要完成的主要有四个任务：

1特征抽取
2生成RP
3分类
4定位回归

RPN（Region Proposal Network）

RPN是Faster RCNN的一部分
输入：图片
输出：可能包含目标object的区域（object proposal）

Faster RCNN

每个feature map上的点产生9个anchor boxs:
3种scale（尺度，个人理解为框的大小） 3个aspect ratios(横纵比)

1x1 conv:保持feature map比例不变
2k:cls判断有无object（但不管是哪种object）
4k:reg给出object的四个坐标（微调了anchor box的大概尺寸）
处理后会删除一部分存在object概率低的anchor box，留下概率较高的。但是也可能存在一些高度重合的anchor box，此时采用non-maximum suppression（非最大值抑制）方法

输入给RPN之前的feature map要保留下来，并且和RPN输出的大概率region组合起来

RoIHead网络结构图
RoI Pooling 是一种特殊的Pooling操作，给定一张图片的Feature map (512×H/16×W/16) ，和128个候选区域的座标（128×4），RoI Pooling将这些区域统一下采样到（512×7×7），就得到了128×512×7×7的向量。可以看成是一个batch-size=128，通道数为512，7×7的feature map。

参考链接：https://zhuanlan.zhihu.com/p/32404424

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。