【论文笔记】：FCOS: Fully Convolutional One-Stage Object Detection

最新推荐文章于 2022-11-18 16:07:41 发布

Activewaste

最新推荐文章于 2022-11-18 16:07:41 发布

阅读量1k

点赞数 1

分类专栏： # Anchor-free # 分类与回归文章标签： FCOS

本文链接：https://blog.csdn.net/qq_41375609/article/details/101170526

版权

FCOS是一种全卷积的一阶段目标检测算法，它摒弃了预定义的锚框，以逐像素预测的方式进行目标检测，减少了计算复杂性和训练内存。通过center-ness分支抑制低质量边界框，提高了检测性能。该算法使用基于FPN的多尺度策略，解决了不同尺度重叠问题。

摘要由CSDN通过智能技术生成

&Title:

FCOS: Fully Convolutional One-Stage Object Detection

&Summary

本文提出了一种全卷积one-stage目标检测算法（FCOS），以逐像素预测的方式解决目标检测问题，类似于语义分割。目前最流行的不论是one-stage目标检测算法，如RetinaNet，SSD，YOLOv3，还是two-stage目标检测算法，如Faster R-CNN。这两类算法大都依赖于预定义的锚框（anchor boxes）。
相比之下，本文提出的目标检测算法FCOS不需要锚框。通过消除预定义的锚框，FCOS避免了与锚框相关的复杂计算，例如在训练期间计算重叠等，并且显著减少了训练内存。更重要的是，FCOS还避免了设定与锚框相关的所有超参数，这些参数通常对最终检测性能非常敏感。FCOS算法凭借唯一的后处理：非极大值抑制（NMS），实现了优于以前基于锚框的one-stage检测算法的效果。

主要过程：

首先以逐像素预测方式重新构造对象检测，接下来利用多级预测来改善召回率并解决重叠边界框导致的模糊性。最后提出的center-ness分支有助于抑制低质量检测到的边界框，并大幅提高整体性能。

最著名的无anchor的目标检测网络是YOLOv1算法，YOLO v1算法出现，告诉我们，回归网络也可以进行目标检测，但是该网络的召回率不要太低。它引入了cell的思想，7x7的来划分图片，每个cell只预测两个bbox，数量不要太少，召回率自然就很低了。所以本文引入了逐像素回归预测的思想，这样一来，就可以解决了召回率的问题了。框多了，但是重叠框也多了，低质量的框也多了。于是采用了基于FPN的多尺度策略，这里作者认为重叠的框的尺度变化比较大，所以采用FPN的多尺度预测，可以有效的解决不同尺度重叠的问题。同时引入了center-ness，来抑制偏离中心点的框，解决低质量bbox的问题。