rpn产生proposals_FPN 记录

最新推荐文章于 2022-07-26 22:12:35 发布

weixin_39697660

最新推荐文章于 2022-07-26 22:12:35 发布

阅读量252

点赞数

文章标签： rpn产生proposals

本文链接：https://blog.csdn.net/weixin_39697660/article/details/111803604

版权

关于FPN，已经见的很多了，但是最近在读FSAF，发现网上的解读刚开始有点看不懂，在FPN选择某一层feature做检测这个问题上，也就是motivation的说明上，因此我再一次细读了FPN论文，做个记录，这篇论文实验做的很细很全啊。。

FPN结构

应用

1 用在RPN上

用ResNet做骨干网络，bottom-up特征集为{C2,C3,C4,C5}，对应着conv2, conv3, conv4, conv5；相对于原图的stride是{4，8，16，32}； up-bottom的特征集是{P2,P3, P4, P5}，对应着C，尺度相同，但是channel都是256(论文中的设置)

设置的anchor

，比例依然是

对应于特征图

为这些anchor设置训练标签，基于与gt box的iou，(策略不变，重复一下：当某anchor与一个gt box有最高iou，或者这个anchor与任一个gt box有超过0.7的iou，设置为positive；当与任何gt box都是iou小于0.3，设置为negative)。

事实上，要清楚的事，这个里面需要选择level这个操作吗，答案是不需要的，因为RPN网络的作用是产生proposals，其实这些不同层的proposals都可以理解为基于原图的，那么产生的大大小小的这些proposals有很多，我们不用管他是来源于哪一层上设置的anchor得来的，(proposal是anchor经过RPN的分类和回归的结果在proposal layer计算得到的)，我们只是得到了很多很多的proposals，和anchor一样多，但是我们只要分数最高的前多少个，比如300，或者1000。

在不同的level上共享参数与否结果影响不大，说明不同level上的金字塔共享相似的语义级别。

2 用在Fast R-CNN

首先简单的回顾一下 R-CNN,Fast,Faster系列的变化： R-CNN用其他方法提出很多个proposals，然后每一个proposals经过CNN提取特征，然后这些特征经过一个SVM分类和回归器；Fast 快的地方在于，这很多个proposals不再一个个经过CNN，而是从一个特征图中提取，这就是ROI pooling；FASter快的地方在于，不再需要用其他的方法得到proposals，二是采用RPN网络，anchor机制来获取所有可能的proposals.

这里要用Fast RCNN，所以要用ROI pooling，所以就需要确定每一个proposal要在哪一层做ROI pooling，是这样安排的。针对一个

的ROI，根据这样的规则

设置为4，因为 faster RCNN就是使用的

作为特征图的。比如宽高是224的一半时，就会被分配到level 3.

分配好了level，就可以做ROI pooling，得到一个

的特征。

实验

1 RPN

在这个RPN上，主要关注的是是否找到了所有可能的的proposals，所以主要专注的是模型的召回率的提升

结果如图

2 Fast RCNN

Fast RCNN 的功能是将proposals分类和回归的更准，因此主要关注的是模型的准确率的提升