&Title:
&Summary
FoveaBox: 一种准确的灵活的完全无锚的物体检测框架。
FoveaBox直接学习对象存在的概率和相一致的边界框的坐标不在使用锚点的参照。实现方式主要有两种:
- 为目标存在的可能性预测类别敏感语义图;
- 为每一个可能包含目标的位置生成未知类别的边界框。
FoveaBox可以在COCO对象检测任务中获得最先进的单模型结果[29]。 我们基于ResNeXt-101-FPN主干的最佳单一模型,其COCO测试开发AP达到42.1,超过了先前发布的大多数基于锚的单一模型结果。
FoveaBox的主要思想借鉴了语义分割,对物体上的每个点都预测一个分类结果,物体边框通过预测偏移量得到。
FoveaBox中还有一些anchor box多尺度的影子,也就是要将物体边框向某个尺度因子归一化,但是毕竟每个特征图只有一个尺度因子,相比经典的基于anchor box的方法,输出量已经大大降低。
&Research Objective
Anchor-free + 类比人类视觉系统感知世界的原理,认为人类先判定某个范围物体是什么,然后再对其边缘轮廓进行仔细判定,而不是去匹配任何事先在脑海里设定的模板矩形框。
&Problem Statement
之前几乎所有先进的目标探测器都是利用预定义的锚去计算要搜索目标的可能位置、尺寸大小以及目标 的纵横比,但是锚的设计也限定了探测器的性能和泛化能力。
锚盒的缺陷:
- 锚箱引入了额外的设计的超参数。设计锚箱的最要因素之一是如何密集地覆盖目标的空间位置。为了实现高的召回率,基于从数据训练集/验证集中计算统计数据精心设计锚。
- 一种基于一些特定数据集的设计选择不总是适合其他的应用程序,导致泛化不足。例如:锚点通常是方形,用于面部检测。行人检测需要更高的锚盒。
- 因为在图像中的大量候选目标位置被有规律的采