【3D目标检测】PointPillars论文和代码解析

最新推荐文章于 2025-03-12 11:34:05 发布

AI松子666

最新推荐文章于 2025-03-12 11:34:05 发布

阅读量3.3k

点赞数 2

文章标签：目标检测 3d 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39523365/article/details/123114224

版权

PointPillars是一款在速度与精度间取得平衡的3D检测模型，它通过将点云数据转化为柱体，形成伪图片进行处理。相比VoxelNet和SECOND等模型，其检测速度更快，且精度不低。作者采用了SSD网络结构进行提案，代码已开源。这篇博客将解析PointPillars的创新点和工作原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.前言

本文要解析的模型叫做PointPillars，是2019年出自工业界的一篇Paper。

该模型最主要的特点是检测速度和精度的平衡。该模型的平均检测速度达到了62Hz，最快速度达到了105Hz，确实遥遥领先了其他的模型。这里我们引入CIA-SSD模型中的精度-速度图，具体对比如下所示
在这里插入图片描述
可以看出，截止CIA-SSD论文发表前，PointPillars的检测速度都是遥遥领先的，而且精度也不低。

现有的一些研究喜欢将不规则、稀疏的点云数据按照以下两种方式进行处理，然后引入RPN层进行3D Bbox Proposal，这两种方法为：

（1）将点云数据划纳入一个个体素（Voxel）中，构成规则的、密集分布的体素集。常见的有VoxelNet和SECOND，这在之前的文章中已经解析过了；

（2）从俯视角度将点云数据进行处理，获得一个个伪图片的数据。常见的模型有MV3D和AVOD，这也说过了。

本文采用了一种不同于上述两种思路的点云建模方法。从模型的名称PointPillars可以看出，该方法将Point转化成一个个的Pillar（柱体），从而构成了伪图片的数据。

然后对伪图片数据进行BBox Proposal就很简单了，作者采用了SSD的网络结构进行了Proposal。

本文的论文地址为：https://link.zhihu.com/?target=https%3A//arxiv.org/abs/1812.05784
代码地址为:https://link.zhihu.com/?target=https%3A//github.com/SmallMunich/nutonomy_pointpillars

2 数据处理和网络结构

前面说到本文的一大亮点是将点云划分为一个个的Pillar，从而构成了伪图片的数据。

如何构成这个伪图片呢？作者在论文中是给出了这样的图，如下。
在这里插入图片描述

3.损失函数

在这里插入图片描述

4 总结

PointPillars是一款能够平衡检测速度和检测精度的3D检测模型。最近我也正在看这个模型的代码，上手玩玩这个模型，希望最后的结果能够惊艳到我（微笑）。如果文章解析部分有理解不到位的地方，欢迎各位批评指正！

写的很清楚，转载自：https://zhuanlan.zhihu.com/p/357626425?ivk_sa=1024320u

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。