ECCV2020语义分割——Deep FusionNet for Point Cloud Semantic Segmentation

最新推荐文章于 2022-12-19 16:44:18 发布

置顶

橘子果酱CV

最新推荐文章于 2022-12-19 16:44:18 发布

阅读量1.7k

点赞数 2

分类专栏：三维点云文章标签：深度学习人工智能神经网络 python 计算机视觉

本文链接：https://blog.csdn.net/Dujing2019/article/details/109195290

版权

FusionNet是一种针对大规模3D点云语义分割的深度学习方法，解决了体素网络和点云卷积方法的局限性。通过融合模块和独特的体素表示，FusionNet实现了高效且精确的特征聚合，提高了点云分割的准确性，同时降低了内存占用。实验表明，FusionNet在大规模点云处理中达到了最新精度。

摘要由CSDN通过智能技术生成

现有方法不足：

尽管基于体素的卷积对于特征聚合很有用，但是如果体素包含来自不同类的点，则它们会产生模棱两可或错误的预测。其他方法（例如PointNet和逐点卷积）可能会采用不规则点进行特征学习。但是它们的高内存和计算成本（例如用于邻域搜索和球查询）限制了它们进行大规模点云处理的能力和准确性。
将许多原始点转移到一个体素上，当体素由不同类别的点组成时，这将在对象边界处产生模棱两可或错误的预测（图1（c））。
在训练大规模点云的深度和鲁棒网络方面受到限制（图1（a）），因为它们在邻域搜索，采样和球查询操作中具有很高的内存和计算复杂性。
基于点的卷积的方法学习近似权重函数或内插卷积权重。与可以直接索引具有固定邻域相对位置的内核的体积卷积相比，在这些点状卷积中，随着点的不规则散布，邻居的位置变得不可预测。因此，必须动态计算相邻点的内核。额外的存储成本和矩阵乘法将限制对大规模点云有效网络的训练，并且由于特征聚合不足而在某些对象中可能产生错误的预测（图1（b））。

提出了一种深度融合网络架构（FusionNet），该架构具有一个独特的基于体素的“ mini-PointNet”点云表示形式和一个用于大规模3D语义分割的新特征聚合模块（融合模块）。
FusionNet充分利用了稀疏属性，减少了内存占用。可以在一个GPU上对于一百万个点进行训练，达到大规模语义KITTI基准测试的最新精度。
与现有的体素网络相比，当体素具有不同类别的点时，FusionNet可以预测逐点标签并避免那些模棱两可/错误的预测。
FusionNet具有更有效的特征聚合操作（包括有效的邻域体素聚合和细粒度的内部体素点级聚合）。这些操作有助于为大规模点云分割产生更高的准确性。继承了体素卷积网络的所有优点（在有效性和效率方面），同时能够学习点状特征以进行准确的标签预测。

关注

专栏目录