Pointpillar算法复现结果分析

卧式纯绿

已于 2024-10-18 15:30:05 修改

阅读量1.5k

点赞数 32

分类专栏： Pointpillar 文章标签：计算机视觉人工智能

于 2024-10-09 15:53:32 首次发布

本文链接：https://blog.csdn.net/qq_52889317/article/details/142786260

版权

Pointpillar 专栏收录该内容

8 篇文章

订阅专栏

由于原论文中作者只给出了基于测试集的数据结果分析（结果如下），在自己花了一天的时间训练之后与官网中作者给出的验证集结果进行对比。

pointpillar官方链接：https://github.com/zhulf0804/PointPillars?tab=readme-ov-file

论文链接：https://arxiv.org/abs/1812.05784

代码：GitHub - open-mmlab/OpenPCDet: OpenPCDet Toolbox for LiDAR-based 3D Object Detection.

算法复现：基于kitti数据集的3D目标检测算法的训练流程_mini kitti 数据集-CSDN博客

一、测试集结果分析

(一)定量分析

上表是KITTI测试BEV检测基准的结果，下表是KITTI测试3D检测基准的结果。所有检测结果均使

用官方KITTI评估指标进行测量，即:鸟瞰图(BEV)、3D、2D和平均方向相似度(AOS)。2D检测在图像平面上完成，平均方向相似度评估二维检测的平均方向(以BEV为单位测量)。KITTI 数据集分为简单、中等和困难的困难，官方 KITTI 排行榜按中等性能排名。如上表所示，PointPillars 在平均精度 (mAP)方面优于所有已发布的方法。与仅激光雷达的方法相比，PointPillars 在所有类和难度层上都取得了更好的结果，除了简单的汽车层。它还优于基于汽车和骑自行车的人的融合方法。

虽然 PointPillars 预测 3D 定向框，但 BEV 和 3D 指标没有考虑方向。使用 AOS评估方向，这需要将 3D 框投影到图像中，执行 2D 检测匹配，然后评估这些匹配的方向。与仅预测定向框的两种 3D 检测方法相比，PointPillars 在 AOS 上的性能在所有层中显着超过。一般来说，只有图像的方法在2D检测上表现最好，因为盒子在图像中的三维投影可以导致松散的盒子，这取决于3D姿势。尽管如此，PointPillars中度自行车AOS为68.16优于最好的基于图像的方法。

（二）定性分析

上图是KITTI的定性分析。作者展示了激光雷达点云(上)的鸟瞰图，以及投影到图像中的3D边界框，以便更清晰的可视化。请注意，作者仅使用激光雷达。展示了汽车（橙色）、自行车（红色）和行人（蓝色）的基本事实（灰色）和预测框。框方向由从底部中心到框前面的直线显示。下图是KITTI上的失败案例。与上图中的相同可视化设置，但专注于几种常见的故障模式。

作者在两张图中提供了定性结果。虽然只在激光雷达点云上进行训练，为了便于解释，作者从 BEV 和图像的角度可视化 3D 边界框预测。图 3 显示了检测结果，具有紧密方向的 3D 边界框。汽车的预测特别准确，常见的故障模式包括困难样本(部分遮挡或远处的物体)上的假阴性或相似类(vans或trams)上的假阳性。检测行人和骑自行车的人更具挑战性，导致一些有趣的故障模式。行人和骑自行车的人通常相互错误分类（有关标准示例，请参见图 4a，图 4d 用于将行人和桌子组合分类为骑自行车者）。此外，行人很容易与极点或树干等环境的狭窄垂直特征混淆(见图4b)。在某些情况下，可以正确地检测到地面实况注释中缺少的对象（参见图 4c）。