VoxelNet: 基于点云的三维空间信息逐层次学习网络

VoxelNet是一种端到端的3D目标检测框架,直接作用于3D点云,通过Voxel Feature Encoding层将点云转换为特征表示,然后使用3D卷积网络进行目标检测。该方法在LiDAR数据上的表现优秀,抛弃了人工特征工程,实现了对点云的多层次学习和高效查询。
摘要由CSDN通过智能技术生成

                                            量化结果。使用LiDAR检测的3D BoundingBox被投影到RGB图像

1. 论文综述

       3D点云中目标的精准检测是很多应用场景的核心问题,如自动驾驶,家居机器人,虚拟/增强现实。为了将高度稀疏的LiDAR点云与区域候选网络连接在一起,很多研究学者将关注带你放在手工设计的特征表达,例如鸟瞰投影a bird's eye view projection. 这份工作中作者放弃了人工设计特征,直接提出了端到端的VoxelNet进行3D目标检测。具体来说,VoxelNet将点云划分为等间距的三维体素,并通过新引入的体素特征编码(VFE)层将每个体素内的一组点转换为统一的特征表示。这样,点云可以被编码成可以描述的体积表征,进而他被量接到区域候选网络进行目标检测。在KITTI数据集上,作者的方法取得了最好的结果。

  • VoxelNet是一种基于点云的-可训练的-端到端的-3D目标识别框架,可以直接作用于系数的3D点云,避免了特征工程;
  • 该框架融合了稀疏点云结构,并且充分利用了voxel grid的并行处理
  • 该文也提出了一种有效的数据增强策略

在基于LiDAR的3D目标检测任务中,大多数方法均采用了特征工程的方法进行算法设计,最多的就是鸟瞰视觉投影。作者创新性的移除了人为的特征工程,并提出了有效的端到端的VoxelNet-3D detection框架。该方法最大的亮点在

  • 2
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值