VoxelNet
1. contribution
- 针对激光雷达获取的高数量级点云数据,提出了一个端到端的可训练深度网络架构,实现精度较高的物体检测任务。
- 将稀疏的点云数据转化为稠密的体素(voxel)张量,能够进行GPU加速。
2. 网络架构
网络架构分为三层:
- 特征提取层:将点云划分为voxel形式,使用层级的VFE层提取特征,得到稀疏的voxel-wise特征张量。
- 中间卷积层:使用3D卷积,得到全局特征张量。
- RPN层:特征整合,anchor提取,输出预测结果:概率预测图,回归图。
2.1特征提取层(Feature Learning Network)
2.1.1 Voxel Partition
将输入的点云空间(DxWxH)均匀划分为voxel,得到D’xH’xW’个voxel。
2.1.2 Grouping
将点云空间中的点划分到其位置对应的voxel中。由于点云的分布不均匀,每个voxel中点的个数不一定相等。(应该有很多空的?)
2.1.3 Random Sampling
对于每个voxel,若所含点数大于T,则随机采样T个。目的:
- 节约开销。
- 降低各voxel之间点个数的不平衡。
2.1.4 Stacked Voxel Feature Encoding
每一层VEF的作用原理这个博客讲的很好,直接贴过来: