论文链接:https://arxiv.org/pdf/1904.01355.pdf
开源代码链接:https://github.com/tianzhi0549/FCOS
一、主要贡献:
1. 将检测与其他全卷积网络可解决的任务统一起来(例如语义分割),可轻松重复的使用这些任务中的方法;
2. 将检测变成一个anchor-free的任务,这将极大地设计参数的数量,减少了这部分各种未知的trick,并且避免了复杂的IOU计算与训练期间的anchor boxes 和 ground-truth boxes匹配,显存也减少了2倍左右;
3. 取得了的state-of-the-art的结果并且FCOS可以被用作RPN,建议社区重新考虑下在目标检测方面anchor-based的必要性;
4. 该方法在简单的改变后也可被用到其他的视觉任务中,如实例分割和关键点检测。
主要网络结构如下图所示:
二、理论方法部分:
1. 全卷积的单阶段网络(FCOS)
类别数C==80,FCOS检测是以基于feature map的一种类似与语义分割的的逐像素的过程,即把每个level的feature map上所有location (x,y)当做训练样本,在这之前要通过公式(s/2 + x*s,s/2 + y*s)先把feature map上所有的location映射回原图的位置。
正样本:某个location (x,y)落在任何ground-truth bounding boxes内并且对应的类别C也在ground-truth类别中。
负样本:不满足正样本的条件的location (x,y),并且类别C别置为0(背景类)
模糊样本:某个location (x