主要算法:
- 下采样
- 金字塔式的特征融合
- 再将融合的进行下采样
- 不同scale的特征融合结果都会接一个head用来后处理
- 后处理部分有3个:
(1)分类 (2)中心度 (3)回归(refine 检测ROI)
创新
(1)Centerness
(2) 解决了YOLO V1的问题,一个检测框里不能同时识别两个instances(也就是提高了小目标密集目标的recall)
* 用FPS解决了
(3)解决了YOLO V1的问题,一味下采样下去失去特征融合,且训练和inference的input必须一致
Loss
正样本:任一点落在GT里,且label预测与GT一致,且只有一个
负样本:没有落在GT里的
Ambiguous样本:任一点落在GT里,但是label显示有多个
Loss = focal loss + IOU loss(回归)
Focal loss
针对正负样本不平衡
来自于binary entropy, 加上了指数和平衡因子
IOU loss
centerness
预测越中心,越接近1. 中心度取0-1,使用binary entropy loss