训练期间的类别失衡是阻碍一级检测器实现最先进的精度的主要障碍。作者提出focal loss的出发点:是希望one-stage detector可以达到two-stage detector的准确率,同时不影响原有的速度。
两级探测器通常用交叉熵损失训练,而不使用α平衡或我们提出的损失。相反,他们通过两种机制来解决类的不平衡:(1)两阶段级联和(2)有偏差的小批量抽样。
交叉熵损失是控制正负样本,假设k 类里面,第i 类是少数类,为了加大错分第i 类的成本,在交叉熵上给第i类乘以一个大于1的系数,这样如果错分第i类的话,交叉熵损失就会增加。神经网络也会更侧重对数目少的样本的分类。
而FL不仅能控制正负样本分类,还可以通过改变y对难分样本进行侧重的训练
Focal loss在交叉熵损失的基础上加了一个因子 (1 − pt)γ,设置γ > 0减少了分类良好的示例的相对损失,将更多的注意力放在难以分类的错误示例上。
对于正样本
Retinanet
RetinaNet是一个单一的、统一的网络,由一个骨干网和两个特定于任务的子网组成。第一个子网对骨干的输出进行卷积对象分类;第二个子网执行卷积包围盒回归。
实验证明RetinaNet不仅可以达到one-stage detector的速度,也能有two-stage detector的准确率。