1. 论文信息
论文标题:《Is Pseudo-Lidar needed for Monocular 3D Object detection?》
代码:GitHub - TRI-ML/dd3d: Official PyTorch implementation of DD3D: Is Pseudo-Lidar needed for Monocular 3D Object detection? (ICCV 2021), Dennis Park*, Rares Ambrus*, Vitor Guizilini, Jie Li, and Adrien Gaidon.
论文:https://arxiv.org/abs/2108.06417
2. 摘要
从单幅图像检测 3D 对象的最新进展利用单眼深度估计作为生成 3D 点云的方法,将相机变成伪激光雷达传感器。 这些两级检测器随着中间深度估计网络的准确性而提高,而中间深度估计网络本身可以通过大规模自监督学习在没有人工标签的情况下得到改进。 然而,它们往往比端到端方法更容易过度拟合,更复杂,并且与类似的基于激光雷达的检测器的差距仍然很大。 在这项工作中,我们提出了一种端到端、单级、单目 3D 对象检测器 DD3D,它可以像伪激光雷达方法一样受益于深度预训练,但没有它们的局限性。 我们的架构专为深度估计和 3D 检测之间的有效信息传输而设计,使我们能够根据未标记的预训练数据量进行扩展。 我们的方法在两个具有挑战性的基准测试中取得了最先进的结果,在 KITTI-3D 基准测试中,汽车和行人(分别)的 AP 分别为 16.34% 和 9.28%,在 NuScenes 上的 mAP 为 41.5%。