Voxel-RCNN论文和逐代码解析

NNNNNathan

已于 2023-12-12 07:33:16 修改

阅读量6.9k

点赞数 19

分类专栏： 3D感知论文分析与代码实战文章标签：深度学习目标检测人工智能自动驾驶计算机视觉

于 2022-03-18 10:00:54 首次发布

本文链接：https://blog.csdn.net/qq_41366026/article/details/123520480

版权

3D感知论文分析与代码实战专栏收录该内容

14 篇文章 69 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

Voxel-RCNN是针对3D点云目标检测的一种新方法，旨在结合Voxel-based的效率和Point-based的准确性。通过使用粗粒度的voxel信息和Voxel ROI Pooling技术，该方法能在保持高性能的同时减少计算开销。网络结构借鉴了SECOND和PV-RCNN，通过Voxel query和加速的PointNet模块提高特征提取效率，实现在速度和精度间的平衡。消融实验验证了Voxel ROI Pooling和加速实现的有效性。

摘要由CSDN通过智能技术生成

1、前言

当前的3D点云目标检测主要分为两种方式，Voxel-based和Point-based。其中很多高性能的3D检测器都基于Point-base的方法，认为该方法表达的特征更具备物体的结构信息，取得更精确的box预测结果；但是point-base的方法因为不规则的数据结构，也让计算开销较大。相反Voxel-based的方法因为能将数据栅格化，更适合进行特征提取操作。

本文作者基于上述观点提出了自己不同的想法，认为精确的原始点云信息对于高性能的3D点云检测器不是必不可少的，同时提出使用粗粒度的voxel（coarse voxel granularity）信息同样可以得到不错的检测精度。

基于此观点，作者设计了Voxel-RCNN，一个基于voxel-based的简单有效的高性能3D点云检测器。为了能充分的利用体素特征（voxel feature）的，作者为此设计了 voxel ROI-Pooling用来提取来自体素的特征信息给二阶段的精调网络。网络结构总览如下图：