【论文笔记】Detecting As Labeling: Rethinking LiDAR-camera Fusion in 3D Object Detection

最新推荐文章于 2025-05-02 13:08:02 发布

byzy

最新推荐文章于 2025-05-02 13:08:02 发布

阅读量1.3k

点赞数 5

分类专栏：多模态融合3D感知（目标检测为主） # 激光雷达与图像融合文章标签：论文阅读目标检测深度学习计算机视觉自动驾驶

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45657478/article/details/136479295

版权

文章介绍了一种新的3D目标检测方法DAL，它将检测过程视为标注，通过简化训练策略和提出速度增广来减少过拟合。实验证明，DAL在性能和速度精度上表现出色，尤其在处理速度分布不均衡的数据集时。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原文链接：https://arxiv.org/abs/2311.07152

1. 引言

目前有很多基于激光雷达与相机融合的3D目标检测方法，但其均违反了一些基本规则，导致其受到过拟合影响。这些方法使用复杂的训练策略进行补偿，但会导致模型陷入局部极小，且需要额外的依赖（如预训练数据集）。

数据集建立时的标注阶段包含两步：首先在图像和激光雷达点云中寻找候选对象，然后根据实例的激光雷达点云生成3D边界框。这个过程需要遵循两个规则：

图像需要与激光雷达点云结合来寻找所有可能的候选对象并确定其类别；
当点云对定位边界框的边界来说足够完整时，3D边界框的生成仅依赖于点云。

规则2则说明边界框的标注是有优先级的，因为点云的几何信息精准而图像的深度估计模糊。违反此规则，引入图像特征进行边界框回归，会导致过拟合。

本文将检测过程视为标注过程，建立DAL，并使用最经典的组件和最简单的训练方式。此外，考虑到速度分布的不均衡，本文提出速度增广策略以减轻这一问题。

实验表明，本文方法有较高的性能和更好的速度精度平衡。

3. 将检测视为标注

在这里插入图片描述
本文的方法流程如上图所示，遵循密集到稀疏的范式。图像特征 $F_I\in\mathbb{R}^{N\times C'\times H\times W}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

byzy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。