FreeAnchor: Learning to Match Anchors for Visual Object Detection阅读

最新推荐文章于 2022-09-03 01:03:08 发布

苏七块

最新推荐文章于 2022-09-03 01:03:08 发布

阅读量3.1k

点赞数

本文链接：https://blog.csdn.net/p1048052071/article/details/100731839

版权

FreeAnchor是一种新的视觉对象检测方法，它摒弃了基于IOU的手动锚框分配，转向学习自由匹配的锚点。这种方法优化了目标分类和定位，确保每个物体至少有一个锚点具有高精度预测。通过最大似然估计训练检测器，FreeAnchor提升了召回率和精度，并保持与非极大抑制（NMS）的兼容性。

摘要由CSDN通过智能技术生成

摘要

现在基于CNN的算法都是使用IOU对目标分配Anchor，我们提出一种方法打破了IOU的限制，允许自由的分配Anchor。我们的方法，称为自由锚（FreeAnchor），将手工锚分配升级为“自由”锚匹配。

FreeAnchor的目标是学习最能分类和定位的特征。FreeAnchor可以和基于CNN的检测器随意融合。

介绍

为了使用有限卷积特征表示具有各种外观，纵横比和空间布局的物体，大多数基于CNN的检测器利用具有多尺度和多长宽比的锚框作为物体定位的参考点。通过将每个物体分配给单个或多个锚框，可以确定特征并进行物体分类和定位。有锚框的物体检测器利用空间关系，即物体和锚框的交并比（IoU），作为锚框划分的唯一标准。基于与物体边界框（Box）空间对齐的锚框（Anchor）最适合于对物体进行分类和定位的直觉，网络在每个锚框处的损失独立地监督下进行学习。然而，在下文中，我们认为这种直觉是不准确的，手工设计IoU匹配物体与特征的方法不是最佳选择。

一方面，对于“偏心”的物体，其最有判别力的特征并不靠近物体中心。空间对齐的锚框可能对应于较少的代表性特征，这会限制目标分类和定位能力。另一方面，当多个物体聚集在一起时，使用IoU标准匹配具有适当锚框/特征的物体是不可行的。亟待解决的问题是如何将锚框/特征与物体完美匹配。

本研究提出了一种学习匹配锚框的物体检测方法，目标是丢弃手工设计的锚框划分，同时优化以下三个视觉物体检测学习目标。首先，为了实现高召回率，检测器需要保证对于每个物体，至少一个锚框的预测足够准确。其次，为了实现高检测精度，检测器需要将具有较差定位（边界框回归误差大）的锚框分类为背景。第三，锚框的预测应该与非极大抑制（NMS）程序兼容，即分类得分越高，定位越准确。否则，在使用NMS过程时，可能抑制具有精确定位但是低分类分数的锚框预测。

本文贡献

将检测器训练作为一个最大似然估计（MLE）的训练过程，并将手工制作的锚分配更新为自由锚匹配。该方法突破了iou的限制，允许对象在最大似然原则下灵活地选择锚。
自定义了一种检测似然估计，并实现了端到端的分类和定位的联合优化。

The Proposed Approach

为了实现以上目标，我们将物体-锚框匹配表示为最大似然估计（MLE）过程，从每个物体的锚框集合中选择最具代表性的锚框。定义每个锚框集合的似然概率为包中各锚框预测置信度的最大值，保证了存在至少一个锚框，对物体分类和定位都具有很高的置信度。同时，具有较大定位误差的锚框被归类为背景。在训练期间，似然概率被转换为损失函数，然后该函数同时驱动物体-锚框匹配和检测器的学习。