motivation
作者指出,有些GT bbox存在包含其他物体,遮挡等现象。同时在训练时以IOU为标准划分的部分负样本也有可能包含重要的语义或者位置信息。因此训练时标签是noisy的。
进而提出cleanliness scores作为一个re-weight因子在训练中对anchor进行调整。
method
cleanliness scores定义如下:
loc_a表示定位confidence(这里作者采用预测box和对应的GT之间的IOU),cls_c表示分类confidence(网络直接预测confidence)。作者称这种做法并没有受到cold start的影响,因为最初网络预测confidence都很低,c最初可认为是IOU的加权粗略表示。Apos和Aneg都是根据IOU选出的TOP-N而非全部。
由于loc_a和cls_c被归一化过,为了增加方差作者进行了改动。因此采用以下结果来计算加权:
其中f(x)=1/(1-x)。r被归一化到1.
整体流程:
一方面,c的设置使得预测输出向软标签c优化。一方面在分类confidence和IOU接近1时(即预测无限逼近GT时),该anchor的加权项r增加。感觉从设计上满足了作者一开始的需求。
focal loss中:
F L ( p t ) = − α t ( 1 − p t ) γ l o g ( p t ) FL(p_{t})=-\alpha_{t}(1-p_{t})^{\gamma}log(p_{t}) FL(p