参考博客:https://blog.csdn.net/qiu931110/article/details/89073244
1. 概述
论文提出了一种新的目标检测方法,通过像素预测方式的目标检测,类似于语义分割。
目前的目标检测都是基于锚框机制的,如two-stage的 Faster R-CNN等,one-stage的RetinaNet,SSD,YOLOv3等。相比之下,本文中提出的FCOS,既避免了预测框与锚框复杂的计算(如IOU的计算),也避免了锚框中一些超参数的设置(如yolov3中多个尺度,需要设置9个锚框的宽和高)。FCOS只需在最后进行NMS运算,即可与锚框机制的目标检测算法达到同样的精度,甚至更高。
2. 网络整体介绍
基于锚框的目标检测尽管已经取得了很好的效果,但仍然有以下几方面的缺点:
一,检测性能对锚箱的尺寸、长宽比和数量非常敏感。这些超参数需要仔细调整;
二,即使经过了对锚框精心的设计,当检测器遇到尺寸变化很大的物体时,泛化能力同样很差,尤其是针对小物体。
预定义的锚盒也妨碍了检测器的泛化能力,因为它们需要在具有不同物体尺寸或纵横比的新探测任务上进行重新设计。
三,输入图片上会产生很多锚框,导致负样本偏多。训练时候负样本过多会导致训练时候类别不均衡。
四,锚框数量多在计算IOU时同样会增加计算和内存。
最近,全