Faster R-CNN基本原理

最新推荐文章于 2021-01-13 19:20:36 发布

weixin_30389003

最新推荐文章于 2021-01-13 19:20:36 发布

阅读量82

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/Tron/p/7747404.html

版权

　　　　　　　　　　　　　　　　　　1.结构图

　　　　　　　　　　　　　　2.RPN原理图

　　主干(backbone)网络输出feature maps，通过RPN得到proposals(也就是包含前景的候选框)。

　　RoI pooling在feature maps中提取出proposals 对应位置上的feature。

　　再利用feature得到更佳精确的候选框，以及候选框中前景所属的类别。

1、RPN

　　RPN在图中feature maps上进行3×3的卷积，num_output=256，在分别进行1×1的卷积，从而feature maps中的每个点都得到k个（论文中取9）boxes和k个cls。

其中boxes边框回归参数，每个点的9个boxes分别与如下图所示的9个anchor boxes（在输入图像中以该点为中心具有一定比例和大小的边框坐标（x1,y1,x2,y2））通过回归对边框坐标进行修正。

cls用于判断边框中的特征是属于前景还是属于背景。

其中boxes和cls是网络要学习得到的特征，而anchor boxes是设置的超参数。这样，feature maps 上的每个点都能得到输入图像中对应的9个边框坐标。但这些边框并不是RPN得到的proposals,

还要根据cls的到其属于前景的概率，根据概率剔除一些边框，并进行NMS(non maximum suppression)非极大值抑制，也即如果两个边框重合度大于某一直时，剔除属于前景概率低的那个边框。

如果是训练阶段，还会根据与ground truth的边框重合度将剩余边框继续分为前景边框和背景边框。最后将输入图像中的边框坐标转换到feature maps上的边框坐标，得到proposals.

　　

转载于:https://www.cnblogs.com/Tron/p/7747404.html

weixin_30389003

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。