这篇文章使用anchor free的方式进行行人检测,在两个数据集上都取得了SOTA的实验结果,论文还将这种方法使用在人脸检测上,同样取得了很好的效果,证明这种方法有很好的泛化能力.我在下一篇写了写这篇论文使用的标签,对理解这篇论文的Loss center有帮助..
论文名称: High-level Semantic Feature Detection: A New Perspective for Pedestrian Detection
论文地址: https://arxiv.org/abs/1904.02948
代码地址: https://github.com/liuwei16/CSP
如果有理解的不对的地方,欢迎指出.
翻译:
摘要:对象检测通常需要传统的滑窗分类器或现代深度学习方法中基于锚箱的预测。但是,这些方法中的任何一种都需要对anchor进行冗长的配置。在本文中,我们提供了一种新的视角,我们将检测对象激励(CNN提取)为高级语义进行特征检测。像边缘,角落,斑点和其他特征检测器一样,所提出的检测器扫描整个图像上的特征点(卷积很适合这样的操作,所以检测器其实就是两个卷积通道)。然而,与这些传统的低级特征不同,我们提出的检测器用于更高级别的抽象:-寻找存在对象的中心点,现在的深度模型已经能够进行这样的高级语义抽象。 此外,像blob检测一样,我们也预测中心点的尺度,这也是一个简单的卷积。因此,在本文中,通过卷积将对象检测简化为直接的中心和尺度预测任务。这样,所提出的方法享有无盒设置。虽然结构简单,但它在几个具有挑战性的基准测试中提供了竞争准确性,包括行人检测和人脸检测。此外,进行了交叉数据集评估,证明了所提出方法的优越的泛化能力。
1. 简介:
特征检测是计算机视觉中最基本的问题之一。它通常被视为低级技术,典型任务包括边缘检测(例如Canny [4],Sobel [42]),角点(或兴趣点)检测(例如SUSAN [41],FAST [38]), 和blob(或感兴趣区域)检测(例如LoG [25],DoG [31],MSER [33])。 特征检测对于各种计算机视觉任务至关重要,从图像表示,图像匹配到3D场景重建,仅举几个例子。
一般情况下,特征定义为我们对图像的“感兴趣”部分,因此特征检测就是首先将计算图像信息抽象,然后在每个图像点做出本地决策,无论在该点是否存在给定类型的图像特征。关于图像信息的抽象,随着计算机视觉任务的快速发展,深度卷积神经网络(CNN)被认为具有非常好的学习高级图像抽象的能力。因此,它也已经应用于特征检测,并且即使在低级特征检测中也展示了有很好的效果。例如,最近有使用CNN进行边缘检测的趋势[40,50,2,29],这已经基本上推进了该领域。它表明,通过深度卷积可以获得干净和连续的边缘,这表明CNN比传统方法具有更强的学习更高