【学习笔记】VoxelNet

最新推荐文章于 2023-05-02 09:57:18 发布

蓝鲸鱼BlueWhale

最新推荐文章于 2023-05-02 09:57:18 发布

阅读量864

点赞数 3

文章标签：卷积网络深度学习 python 机器学习

本文链接：https://blog.csdn.net/weixin_44579633/article/details/107922384

版权

根据voxel中的point特取得到voxel特征，进一步提取到更加全局的特征。
对voxel中的点采用几层全连接层将voxel中的Point信息映射到高维，最后再在每个特征维度上使用maxpooling得到voxel的特征。3DCNN是对这样一个(H,W,L,C)的四维张量做3D空间中的卷积。
经过4次步长为2的卷积，再加一次额外的高度维的步长为2的卷积后得到了中间图的三维feature map，将高度维的特征直接压缩到特征维中，变成了二维的featuremap。此后就可以采用二维RPN(区域生成网络RegionProposal Network) 网络结构对三维物体进行目标检测。

在这里插入图片描述

卷积核为三维，参数量巨大，可能不好学习或者导致过拟合。
含有很多空的voxel，卷积过程将其特征填充为0，占显存，时间效率低。
解决办法：稀疏卷积，只对含有点的voxel做卷积输入。
具体：先将原始空间中的非空的voxel的空间索引记录起来，将其特征排成一列map，卷积操作通过计算索引完成，最终的结果仅在二维中通过索引计算得到。将final-feature-map通过最终的空间索引还原成voxel表达。和上面一样将H层直接压缩到特征。
backbone特征提取实际上是逐渐将H维度降低为2，最后再压缩为1，如何更好的利用点云的整体信息
空的voxel虽然对3D CNN是一种显存的损失，但维持了三维物体的几何结构，经过Backbone的CNN过程，会导致原本是空的voxel变得有信息，从而丢失了几何结构信息。

关注