来源:雷克世界@微信公众号
原文链接:arxiv
作者:Martin Simon、 Stefan Milz、Karl Amende、Horst-Michael Gross
编译:KABUDA、EVA
基于激光雷达的三维目标检测对于自动驾驶而言是不可避免的选择,因为它与对环境的理解直接相关,从而为预测和运动规划奠定了基础。对于除了自动化车辆之外的许多其他应用领域,例如增强现实、个人机器人或工业自动化,对实时高度稀疏的三维数据进行推断的能力是一个不合适的问题。
我们引入了Complex-YOLO,这是一种最先进的仅针对点云(point clouds)的实时三维目标检测网络。在本研究中,我们描述了一个网络,该网络通过一个特定的复杂的回归策略来估计笛卡尔空间(Cartesian space)中的多类三维立方体,从而扩展YOLOv2(一种用于RGB图像的一个快速二维标准目标检测器)。
因此,我们提出了一个特定的Euler区域提议网络(Euler-Region-Proposal Network,E-RPN),通过在回归网络中添加一个虚构的和一个真实的分数来估计目标的姿势。这是在一个封闭的复杂空间中结束的,从而避免了单角度估计的奇异性。E-RPN支持在训练过程中进行良好的泛化。
我们在KITTI基准套件上进行的实验表明,我们的性能优于当前领先的三维目标检测方法,尤其在效率方面。我们取得了对汽车、行人和骑车者进行测试的最先进的结果,比最快的竞争者快5倍以上。此外,我们的模型能够同时以高精确度估计所有的8个KITTI类,包括货车、卡车或坐着的行人。
近年来,随着汽车激光雷达传感器的巨大完善,点云处理对自动驾驶而言变得越来越重要。供应商的传感器能够实时