[CVPR20‘论文阅读]PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection

该文章介绍了一种新的3D目标检测方法PV-RCNN,它结合了体素CNN和PointNet,通过体素集合抽象和RoI-grid池化来提高性能。实验证明其在KITTI和WaymoOpen数据集上优于现有方法。
摘要由CSDN通过智能技术生成

Shi, S., Guo, C., Jiang, L., Wang, Z., Shi, J., Wang, X., & Li, H. (2020). PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 10529–10538. https://doi.org/10.1109/cvpr42600.2020.01054

摘要
我们提出了一种新颖且高性能的3D目标检测框架,称为PointVoxel-RCNN(PV-RCNN),用于从点云中准确地检测3D目标。我们的方法深度融合了3D体素卷积神经网络(CNN)和基于PointNet的集合抽象,以学习更具区分性的点云特征。它利用了3D体素CNN的高效学习和高质量提案以及基于PointNet网络的灵活感受野。具体而言,所提出的框架通过一个新颖的体素集合抽象模块,将3D场景总结为一小组关键点,以节省后续计算并编码具有代表性的场景特征。在由体素CNN生成的高质量3D提案的基础上,提出了RoI-grid池化,通过关键点集合抽象将提案特定的特征从关键点抽象到RoI-grid点。与传统的池化操作相比,RoI-grid特征点编码了更丰富的上下文信息,可用于准确估计对象的置信度和位置。在KITTI数据集和Waymo Open数据集上的大量实验证明,我们提出的PV-RCNN在3D检测方面超过了现有方法,并取得了显著的优势。

在这里插入图片描述
图1:我们提出的PV-RCNN框架通过两步策略(包括体素到关键点的3D场景编码和关键点到网格RoI特征抽象)深度融合了基于体素和基于PointNet的网络,以提高3D目标检测的性能。

在这里插入图片描述
图2:我们提出的PV-RCNN的总体架构。首先对原始点云进行体素化,然后输入3D稀疏卷积编码器以学习多尺度语义特征并生成3D目标提案。接着,通过新颖的体素集合抽象模块,将多个神经层的学到的体素-wise特征体积总结为一小组关键点。最后,将关键点特征聚合到RoI-grid点,学习提案特定的特征,用于精细的提案细化和置信度预测。

在这里插入图片描述
图3:预测关键点权重模块的示意图。

在这里插入图片描述
图4:RoI-grid池化模块的示意图。通过具有多个感受野的集合抽象操作,聚合了每个3D RoI的丰富上下文信息。

  • 7
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王知为

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值