摘要
在对象检测中,基于关键点的方法经常遭受大量不正确的对象边界框,可以说是由于缺少对裁剪区域的额外观察。本文提出了一种有效的解决方案,以最小的成本探索每个裁剪区域内的视觉模式。我们在一个名为CornerNet的代表性基于关键点的代表检测器上构建我们的框架。我们的方法名为CenterNet,将每个对象检测为三元组而不是一对关键点,从而提高精度和召回率。因此,我们设计了两个名为级联角池和中心池的定制模块,它们分别丰富了左上角和右下角收集的信息,并在中心区域提供了更多可识别的信息。在MS-COCO数据集上,CenterNet实现了47.0%的AP,其性能优于所有现有的单级探测器至少4.9%。同时,通过更快的推理速度,CenterNet展示了与顶级两级探测器相当的性能。 代码可在https://github.com/Duankaiwen/CenterNet获得。
1、简介
借助深度学习,尤其是卷积神经网络[11](CNNs),物体检测得到了显着的改进和提升。
在当前时代,最流行的流程图之一是基于锚节点,它放置了一组具有预定义大小的矩形,并在帮助下找到真实物体的位置。这些方法通常需要大量锚点以确保与地面实况对象具有足够高的IoU(交联结合)速率,并且每个锚箱的尺寸和纵横比需要手动设计。另外,锚点通常不与真实物体框对齐,这不利于边界框分类任务。