一、论文
(19)Region Proposal by Guided Anchoring
https://arxiv.org/abs/1901.03278
二、论文笔记
1、背景
(1)、原本的anchors 生成不够高效
(2)、不同的问题需要预先定义不同的锚,但是anchor定义的不合适的话,可能会影响结
(3)、为了维持极高的召回率,需要定义很多的anchor ,这会带来很大的计算开销
(4)、anchor free 的方案由于缺少anchor 以及对阶段的优化处理对处理复杂场景的问题能力有限
(5)、之前的ROI Pooling ROI Align的方法,bbox的坐标值是预测出来的,所以它有可能不是在像素的整数的位置上,因此bbox 和它应该有的特征可能有错位。
2、创新点
(1)、创新来源,通过观察发现物体的尺度和图像的内容很有关系。分为两步,先在图像里面确定可能包含的物体的小区域,然后决定不同位置的物体(anchor)的形状
(2)、在FPN的每一个输出后面做了一个Guided anchoring model 包含两个分支,location prediction branch:一个用来预测该位置是否包含物体的中心,shape prediction branch:一个用来预测物体的形状。
(3)、anchor-guided feature adaptation:根据feature map上每个位置的特征值,以及前面生成的形状来产生该位置的特征值,作为新的feature map
增加了一个 Feature Adaption 模块来解决这种问题。思路很简单,就是把 anchor 的形状信息直接融入到特征图中,这样新得到的特征图就可以去适应每个位置 anchor 的形状。我们利用一个 3x3 的 deformable convolution 来修正原始的特征图,而 deformable convolution 的 offset 是通过 anchor 的 w 和 h 经过一个 1x1 conv 得到的。(此处应该划重点,如果是像正常的 deformable convolution 一样,用特征图来预测 offset,则提升有限,因为没有起到根据 anchor 形状来 adapt 的效果)
3、细节
(1)、Anchor location targets:
卷积之后跟随sigmod激活函数
损失Focal Loss
Anchor shape targets:
bounded iou loss
(2)、
使用GA-RPN 因为高质量的proposal 较多,所以需要设置更大的正负样本阈值,用更少的样本来end to end来训练模型
4、实验
(1)、
(2)、
5、疑问
(1)、anchor shape target的 形成过程那里看的还不是太懂。