【点云】《RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds》

BeringStrait_

已于 2024-03-27 19:55:08 修改

阅读量958

点赞数 12

分类专栏：点云文章标签： python dnn

于 2024-03-26 11:19:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51954707/article/details/137040576

版权

点云专栏收录该内容

4 篇文章

订阅专栏

文章目录

RandLA-Net主攻大规模场景点云语义分割
之前的网络都是应用于较小点集的，且对语义分割没有太大进展，因为存在以下三个问题：

这些网络的点采样方法要么计算成本高，要么内存效率低
依赖于计算昂贵的kernelisation或graph construction,因此无法处理大量的点
感受野大小有限,无法捕获复杂的结构，要么效率低下

基于这些缺点，RandLA-Net：

寻找一种能覆盖整个点集且计算量可接受的采样方法–随机采样（Random Sampling，所以叫RandLA-Net）
随机采样不是没有代价的，因此需要配套一种高效的局部特征学习器，过逐步增加每个点的感受野来保留复杂的局部结构

采样方法

最远点采样：随机选一个初始点—找一个点集中离初始点最远的点—从剩余的点中选择一个与已选点集中所有点距离最远的点—直到选够。计算量太大，不适用于大规模点云
逆密度重要性采样：看每个点的k近邻点密度—密度越高点越重要—从密度最低开始选子集直到选够。倾向于选择那些周围点较少的点，从而在减少点数的同时保留了点云的多样性，但是对异常值很敏感。而且计算量也挺大
随机采样：贼快

然而，随机采样可能会导致许多有用的点特征被丢弃。为了克服这个问题，我们提出了一个强大的局部特征聚合模块（为了一个有价值的大洞打了一个大补丁）

Local Feature Aggregation局部特征聚合

由三个主要块拼成，1) 局部空间编码(LocSE)，2) 注意力池化，3) 扩张残差块
这张图画的很好：

LocSE

LocSE：输入的点云中，找到每个点云的k近邻，形成(k,3+d)，之后将三维特征(k,3)和其他特征(k,d)分开。(k,3)进行相对点位置编码，公式如下：
生成(k,d)维的特征，然后与其他特征串联生成(k,2d)的中心点 pi 的局部几何结构进入注意力池化块。

注意力池化

注意力池化：输入的局部几何特征 Fik 计算注意力分数 Sik，公式如下，函数 g() 由共享 MLP 和 softtmax 组成，其中 W 是共享 MLP 的可学习权重

得到的Sik与之前的 Fik 作点积后计算加权总和，得到最终特征向量 fi。

总而言之，给定输入点云 P ，对于第 i 个点 pi ，我们的 LocSE 和注意力池单元学习聚合其 K 个最近点的几何图案和特征，并最终生成信息丰富的特征向量 fi

扩张残差块

扩张残差块：受到Resnet的启发，多次叠加使用 Shared MLP + LocSE + AttentionPooling 组合，这样可以增大每个点的receptive field，就相当于间接地增加了每个点的传播范围。考虑多种因素该论文最后stack了两组。

注：该文中扩张卷积（dilated convolution）的体现并不是直接以传统意义上的扩张卷积层来实现，而是通过设计特定的网络结构来模拟扩张卷积的效果，从而增加每个点的接收场（receptive field）

注：LocSE和注意力池化都是扩张残差块的组成部分，一个块用两套，扩张残差块加上MLP变成了局部特征聚合LFA，四套LFA加上RS是网络的编码器部分；解码器部分则为四套MLP加上US，其中的US是最近邻插值

博客等级

码龄5年

14
原创

185
点赞

204
收藏

143
粉丝

关注

私信

热门文章

分类专栏

点云 4篇
MOS 7篇
自己看
Tutorials 3篇

展开全部收起

最新评论

【MOS】《RVMOS: Range-View Moving Object Segmentation Leveraged by Semantic and Motion Features》
soleil_w: 这个是没有源码实现的吗
【MOS】MotionSeg3D-《Efficient Spatial-Temporal Information Fusion for LiDAR-Based 3D Moving Object Seg
CSDN-Ada助手: 恭喜您第14篇博客《【MOS】MotionSeg3D-《Efficient Spatial-Temporal Information Fusion for LiDAR-Based 3D Moving Object Seg》的成功发布！您对于三维运动目标分割的研究深入浅出，让读者对于这一领域有了更深入的理解。接下来，我建议您可以在研究中更加注重实验数据的分析和对比，或者探索一些新的方法和技术，为读者带来更多的启发和思考。期待您在接下来的创作中继续精益求精，不断进步！
【MOS】《RangeNet++: Fast and Accurate LiDAR Semantic Segmentation》
CSDN-Ada助手: 恭喜您发布了第12篇博客！《RangeNet++: Fast and Accurate LiDAR Semantic Segmentation》这篇文章内容丰富，对LiDAR语义分割进行了深入探讨，让读者受益匪浅。希望您能继续坚持创作，分享更多有价值的内容。下一步建议可以考虑加入更多实际案例分析，或者深入探讨算法的优缺点，让读者更好地理解和应用所学知识。期待您更多精彩的作品！
【MOS】4DMOS-《Receding Moving Object Segmentation in 3D LiDAR Data Using Sparse 4D Convolutions1》
CSDN-Ada助手: 恭喜用户第10篇博客的发布！标题中的4DMOS主题听起来非常有趣和挑战性，看来您对点云数据处理有着深入的研究和探索。希望您能继续保持创作的热情和耐心，不断挖掘点云数据处理领域的更多可能性。或许下一步可以对该主题进行更深入的分析和实践，分享更多有关4D卷积在点云数据中的应用和优势。期待您的更多精彩内容！祝您创作顺利！
【点云】《PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space》
CSDN-Ada助手: 恭喜您发布了第6篇博客！标题看起来非常专业和有深度，对点云技术的研究十分有价值。希望您能继续保持创作的热情和劲头，分享更多关于点云的研究成果和思考。或许在未来的文章中，可以加入一些实际案例或者应用场景的分析，让读者更好地理解和应用您的研究成果。期待您更多精彩的作品！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。