作者针对两个问题:
1.如何使anchor-free模型head性能更好?
2.如何更好地利用特征金字塔?
作者证明了,不高效的训练是造成anchor-point detector无法成为最优的主要原因。
分别给出了原因:注意力偏差和特征选择。
最后给出方案:soft-weighted anchor points and soft-selected pyramid levels
其中,注意力偏差指"拥有良好视野的物体过多的吸引检测器的注意力"而特征选择和我论文的第二点意思相当。
注意力偏差解释如下图:
作者想表达的意思是,站在较远处的人相对的没有获得与更加"前景"的人相当的confidence(颜色略浅)。但是下图作者的改进中似乎仍然没有解决这一问题。对此,作者给出的原因是:在目标边界处没有必要的高confidence导致了特征的misalignment。在边界处的anchor没有与目标对应得很好的特征(被背景或其他目标遮挡)。
作者的解决方法:
将目标实际位置与anchor的中心的距离作为一个anchor的惩罚权重,加入到损失函数的计算中(仅针对正样本,负样本不做改动)。公式和图例如下: