自动驾驶纯视觉3D物体检测算法

最新推荐文章于 2024-07-08 09:22:49 发布

自动驾驶小学生

最新推荐文章于 2024-07-08 09:22:49 发布

阅读量1.3k

点赞数 3

分类专栏：论文笔记文章标签：自动驾驶 Pseudo-LiDAR 视觉3D物体检测

本文链接：https://blog.csdn.net/cg129054036/article/details/120256077

版权

论文笔记专栏收录该内容

64 篇文章 168 订阅

订阅专栏

该博客分享了Pseudo-LiDAR技术在3D物体检测中的应用，探讨了激光雷达与视觉检测的差异，并提出了一种将深度图转换为伪点云的方法。通过改进损失函数和多传感器融合，显著提高了纯视觉3D检测性能，最终在某些难度级别上接近激光雷达的检测效果。

摘要由CSDN通过智能技术生成

在这里插入图片描述
视频链接：https://www.shenlanxueyuan.com/open/course/112

这是Pseudo-LiDAR作者最近做的一个分享报告：《Pseudo-LiDAR：基于相机的3D物体检测算法》。在这份报告里，作者主要介绍了博士期间的研究成果：基于深度学习的深度估计，纯视觉3D物体检测算法。

1. Background

作者首先介绍了激光雷达用于物体检测存在的问题：价格昂贵，易受天气影响（雨天或雾天）、点云稀疏。

然后介绍了激光雷达和视觉3D物体检测的Pipeline，在KITTI数据集中，LiDAR Pipeline输入为点云和前视图；视觉检测Pipeline中输入立体图像首先生成深度图，然后前视图和深度图一起输入到检测模型中。

在KITTI数据集上，可以看到视觉检测性能远远低于LiDAR检测性能，有4倍差距还多？

作者因此猜想是什么原因导致检测性能相差这么大：深度估计不准？图像表达形式？
在这里插入图片描述
作者首先进行了深度比较，将生成的伪激光雷达点云与真实点云进行比较，可以看到二者深度基本是一样的，所以深度估计是准确的，不是造成性能相差巨大的原因。

然后作者做了另外一个实验，在深度图上进行2D卷积操作，可以看到卷积操作之后对应的伪激光雷达点云扩散了，发现这是造成图像3D物体检测性能低的主要原因。
在这里插入图片描述
因此作者提出了伪激光雷达点云3D检测的方法，首先生成伪激光雷达点云，然后再使用点云3D物体检测器进行检测，这里作者没有设计新的检测算法，可以看到检测性能也已经提升了3倍左右。

2. Pseudo-LiDAR Detection

不难看出，伪点云中，深度估计越准，最终检测性能越高，因此作者提出了新的深度估计方法（改进损失函数），即将之前的Disparity估计问题直接转换成深度估计问题，这一部分估计使用神经网络实现。
在这里插入图片描述
在上面的深度估计方法中，Depth Cost Volume 维度为图像维度+深度维度，作者进一步改进损失函数，将其维度直接转换成激光雷达坐标维度，可以看到检测性能进一步提高（PLUMNet）。

为了进一步提高检测性能，作者使用了多传感器融合的方法，将伪激光雷达与真实激光雷达相融合。这里作者将64线的激光雷达下采样为4线激光雷达。

思想是使用4线真实激光雷达去纠正伪激光雷达点云位置，结果如下：可以看到纠正后的点云位置基本都在Bounding box中。

最终检测结果如下，在Easy难度检测结果上与激光雷达检测结果已经基本相同。

总结一下，在视觉3D检测中，作者提出了四种改进方法：

深度图转换成伪点云，使用点云3D物体检测器进行检测，性能提升了3倍左右；
改进损失函数，将Disparity损失函数改为Depth损失函数，深度估计更准，性能进一步提升；
改进损失函数，将图像维度+深度维度损失函数改为激光雷达坐标维度损失函数，性能再一次提升；
多传感器融合，使用更便宜的真实激光雷达（4线）去纠正伪点云位置，Easy难度检测结果与激光雷达检测结果基本相同。

自动驾驶小学生

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
自动驾驶纯视觉3D物体检测算法

这是Pseudo-LiDAR作者最近做的一个分享报告：《Pseudo-LiDAR：基于相机的3D物体检测算法》。在这份报告里，作者主要介绍了博士期间的成果：基于深度学习的深度估计，纯视觉3D物体检测算法。1.2.3....
复制链接

扫一扫

专栏目录