论文阅读笔记（Region Proposal by Guided Anchoring）

最新推荐文章于 2023-08-17 16:08:44 发布

哼哼和哈哈

最新推荐文章于 2023-08-17 16:08:44 发布

阅读量318

点赞数

Region Proposal by Guided Anchoring

Abstract
Introduction

Abstract

anchors是现在模型检测的基石。SOTA检测器大多都有一个密集的anchoring理论，其中anchor都是根据事先定义好的一系列尺度和横纵比在空间上均匀采样得到的。在本文中我们回顾这个基础理论，我们的研究表明可以做到更加的高效和有效。特别地，我们提出一个理论，叫做Guided Anchoring，通过语义特征指导生成anchor。提出的方法可以同时预测可能存在的目标的中心位置以及在不同位置上的横纵比。在预测锚定形状的基础上，利用特征自适应模块来缓解特征不一致性。我们同时研究了高质量的候选框来提高检测性能。本文提出的Guided Anchoring可以无缝应用到任何现有的使用anchor的检测算法中。利用Guided Anchoring, MS COCO的recall提高了9.1%，并且比RPN的Baseline版本少了 90% anchors。我们同时应用Guided Anchoring到Fast R-CNN, Faster R-CNN 和 RetinaNet中, 分别提高了map 2.2%, 2.7% 和 1.2%。

Introduction

现在目标检测算法，开始的时候会有很多密集分布的anchors。例如很受欢迎的Faster RCNN算法，首先是从密集的anchors生成proposals，然后是把这些proposals分到特定的类别，再通过bbox回归，refine它们的位置。

 (x,y,w,h)表示一个位置，（x，y）为中心坐标，服从下面的条件分布：

图片: 在这里插入图片描述
上面的因式可以看出：在一副图片中，目标存在于特定的区域，且形状、尺度以及方向比与位置相关。基于此，设计了anchor生成模型，如下图红框中所示。该模型是由位置和形状预测的两个branch组成的网络。已知一张图片，首先获取feature map，然后位置预测分支预测可能存在目标的概率图，形状预测分支基于位置概率图预测形状。

图片: 在这里插入图片描述
anchor位置预测
位置预测分支产生一个与feature map相同尺寸的概率map，该概率map是在输入feature map上进行1x1卷积，然后经过element-wise sigmoid 函数得到
anchor形状预测
直接预测w和h不稳定，因此形状预测分支输出dw和dh，通过下面的映射关系映射到w和h
图片: 在这里插入图片描述
其中s为stride，sigma为经验尺度因子，文中设置为8。形状预测网络为1x1卷积，输出两个通道，以及一个element-wise变换层（上面映射函数）
Anchor-Guided Feature Adaptation

anchor-guided feature adaptation component ，基于下面的公式对feature进行变换：
图片: 在这里插入图片描述
NT为3x3的deformable卷积层

训练：
损失函数
图片: 在这里插入图片描述
训练location时，每个图片需要一个binary label map，1表示有效的位置需要一个anchor，0则相反。R(x,y,w,h)表示矩形区域
文中定义了三种区域：CR，IR，OR，分别表示ground truth的中心区域，ground truth外扩后扣除CR的区域，以及feature map上出处CR和IR的区域，CR区域标记为positive sample ，IT标记为ignore，OR为negative sample，以上三个区域是和feature map的scale相关的。
图片: 在这里插入图片描述
location branch 采用损失函数为focal loss

anchor shape需要两步来决定每个anchor的最佳shape，首先需要匹配到ground truth，其次最小化该anchor和匹配的ground truth的IOU。
图片: 在这里插入图片描述
上述vIoU很难implemented ，因此选择一下w和h与gt进行匹配，并选择最大值作为上式的近似。文中选择了9对w和h。