该论文主要想解决在目标检测one-stage中正负样本数量差异过大,本文中将更多的注意力放在难分类的错误分类上,重点训练困难的负样本,这篇文章是首次one-stage目标检测算法的性能超过two-stage的目标检测算法。
该论文中提出了一种新的损失focal loss 损失,该损失能够使得正样本的损失变小,负样本也变小,但相比于正样本缩放比例微不足道。感觉类似于softmax操作。
网络架构采用Resnet+FPN的结构,最后输出的维度中K为classes的个数,不包括背景,A为预测框的个数,与FasterRNN不同,这里最多取1k个Box预测,采用0.5nms进行非极大值抑制,iou大于0.5归为正样本,0.4-0.5舍弃,小于0.4归为负样本。在将NMS应用于所有示例后,小批量被构造为强制实施阳性和阴性之间的1:3比率,以帮助确保每个小批量具有足够的阳性。
与FPN不同,他不再使用conv2处的特征,新增了一个p7,P6与FPN的P6也有不同,这里的P6采用卷积下采样代替FPN中的最大池化下采样 ,P7在P6的基础上接着进行卷积下采样,获取更高细粒度的特征。
在Anchors的选区中,新增了三个anchor的大小比例,采用3个scale,每个预测层有9组Anchors