PV-RCNN

最新推荐文章于 2024-06-03 09:49:16 发布

xinxiang7

最新推荐文章于 2024-06-03 09:49:16 发布

阅读量751

点赞数

分类专栏： paper阅读文章标签： 3D目标检测

本文链接：https://blog.csdn.net/xinxiang7/article/details/113753776

版权

paper阅读专栏收录该内容

14 篇文章 4 订阅

订阅专栏

PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection

Abstract

PointVoxel-RCNN是一个新颖的,高表现的3D目标检测框架,从点云中检测3D目标. 我们的方法整合了voxel 3D CNN和基于PointNet的集抽象来学习更多的有鉴别行的点云特征.它充分利用了高效的学习,3D体素的CNN的高质量的proposals以及基于PointNet网络的灵活的感受野.该框架通过一个新的体素集抽象模块将三维场景与三维体素CNN总结成一组小的关键点，以节约后续计算, 同时还用于对代表性的场景进行编码. 给定由体素CNN生成的高质量的3D proposals, RoI grid pooling通过关键点集抽像从关键点到RoI-grid来抽象特定proposal的特征.相比于传统的池化操作,RoI grid 特征点编码更加丰富的语义信息来准确的评估目标置信度和位置.

Introduction

两种点展示的融合: 基于体素的3D CNN和基于PointNet的集抽象.

采用的是两步走策略:

voxel-to-keypoint scene encoding
keypoint-to-grid RoI teature abstraction

voxel-to-keypoint scene encoding:

采用三维稀疏卷积的体素CNN进行体素特征学习和精确的psoposals生成。为了缓解上述需要太多体素来编码整个场景的问题，通过最远点采样(FPS)选择一组小的关键点，从体素特征中总结出总体的三维信息。通过基于PointNet的集合抽象对相邻的体素特征进行分组，对每个关键点的特征进行聚合，以总结多尺度点云信息。这样，整个场景就可以由少量具有相关多尺度特征的关键点有效和高效地编码。

keypoint-to-grid RoI teature abstraction:

考虑到每个框方案及其网格点位置，提出了一个RoI网格池模块，其中每个网格点采用具有多半径的关键点集抽象层，从具有多尺度上下文的关键点聚合特征。然后，所有网格点的聚合特征都可以联合用于后续的置信度预测和细粒度框细化。