&Title:
&Summary
本文提出了一种全卷积one-stage目标检测算法(FCOS),以逐像素预测的方式解决目标检测问题,类似于语义分割。目前最流行的不论是one-stage目标检测算法,如RetinaNet,SSD,YOLOv3,还是two-stage目标检测算法,如Faster R-CNN。这两类算法大都依赖于预定义的锚框(anchor boxes)。
相比之下,本文提出的目标检测算法FCOS不需要锚框。通过消除预定义的锚框,FCOS避免了与锚框相关的复杂计算,例如在训练期间计算重叠等,并且显著减少了训练内存。更重要的是,FCOS还避免了设定与锚框相关的所有超参数,这些参数通常对最终检测性能非常敏感。FCOS算法凭借唯一的后处理:非极大值抑制(NMS),实现了优于以前基于锚框的one-stage检测算法的效果。
主要过程:
首先以逐像素预测方式重新构造对象检测,接下来利用多级预测来改善召回率并解决重叠边界框导致的模糊性。最后提出的center-ness分支有助于抑制低质量检测到的边界框,并大幅提高整体性能。
最著名的无anchor的目标检测网络是YOLOv1算法,YOLO v1算法出现,告诉我们,回归网络也可以进行目标检测,但是该网络的召回率不要太低。它引入了cell的思想,7x7的来划分图片,每个cell只预测两个bbox,数量不要太少,召回率自然就很低了。所以本文引入了逐像素回归预测的思想,这样一来,就可以解决了召回率的问题了。框多了,但是重叠框也多了,低质量的框也多了。于是采用了基于FPN的多尺度策略,这里作者认为重叠的框的尺度变化比较大,所以采用FPN的多尺度预测,可以有效的解决不同尺度重叠的问题。同时引入了center-ness,来抑制偏离中心点的框,解决低质量bbox的问题。
&Research Objective
anchor-free + 基于语义分割的思想,提出了逐像素预测的方式来解决目标检测问题