Fcos: Fully convolutional one-stage object detection 论文阅读小结

最新推荐文章于 2024-05-22 18:16:22 发布

亚里

最新推荐文章于 2024-05-22 18:16:22 发布

阅读量299

点赞数

分类专栏：论文阅读文章标签： FCOS 目标检测

本文链接：https://blog.csdn.net/PAN_Andy/article/details/104975569

版权

论文阅读专栏收录该内容

16 篇文章 2 订阅

订阅专栏

Abstract:

FCOS方法是一种anchor的方法，不需要预定义的anchor，避免了由anchor引起的复杂的计算，也减少了针对anchor的超参数，这些超参数对最终的检测结果影响很大。
只使用了一个NMS后处理程序，FCOS就能以非常简单的特性超过此前的一阶检测器，这篇论文也是第一提出如此简单且灵活的高精度检测框架。
FCOS能够为例如实例分割等任务服务。
ICCV'19，code：https://github.com/tianzhi0549/FCOS

Motivation:

此前的主流检测器例如Faster R-CNN，SSD,YOLOv2,v3都依赖于预定义的anchor box来取得优异的性能，但是基于anchor box的方法有以下缺点：①检测性能对尺寸、长宽比和anchor box的数量都很敏感。②即使有精心设计的anchor box，由于anchor box的尺度和长宽比都是固定的，检测器对一些具有大的形状变化的候选物体，尤其是对一些小物体，非常具有难度。预定义的anchor box限制了检测器的活化性能，对于新的任务必须重新设计anchor box。③为了达到较高的召回率，必须要输入图像上设置密集的anchor，在训练的过程中，会有大量的anchor box是负例，这使得正例和负例非常不均衡。④大量的anchor box导致了复杂的计算，例如计算IoU score。
目前的视觉任务例如semantic segmentation、depth estimation、key point detection、counting等都是可以用全卷积网络达到非常好的性能的，但是由于anchor box的使用，在检测上还没有办法应用FCN。因此，自然地会产生一个疑问，能以逐像素的形式，使用FCN解决检测任务吗？本文给出了肯定的答案。并且本文的方法第一次表明，更简单的FCN-based detector能够比anchor-based detector达到更好的性能。
基于FCN框架的检测器，在特征图的级别上预测一个4D向量和一个类别分数，例如Dense-Box，但是为了解决bounding boxes的不同尺寸，DenseBox将图像裁剪并重置为固定的尺寸，在图像金字塔上进行检测，这违反了FCN只进行一次卷积的初衷。并且这种检测器只能用于检测特定任务，在通用任务上，通常会产生歧义。这篇论文发现FPN可以很好地解决这个问题。
在检测的过程中会发生很多远离物体中心的低质量的预测框，为了解决这个问题，论文提出了center-ness分支，可以极大地抑制低质量检测框，提高检测性能。