论文:https://arxiv.org/pdf/1911.11236.pdf
代码:https://github.com/QingyongHu/RandLA-Net
应用领域:大场景(如室外)的点云语义分割
数据集:
主要贡献:提出更快的点云语义分割模型。
- 对比现有的采样方法,发现随机采样最好。
- 为了减小随机采样丢失的信息,提出局部特征采样器,包括 Local Spatial Encoding (LocSE) 和 Attentive Pooling。
总的来说,这篇论文讲述详实,内容容易理解,简单而又高效。
采样
作者对比了现有的几种采样方法,包括 PointNet、PointNet++ 等中使用的最远点采样(Farthest Point Sampling,FPS),其计算复杂度为 O ( N 2 ) O(N^{2}) O(N2),处理 N 1 0 6 N ~ 10^{6} N 106 点云数据需要约 200 秒;逆密度采样(Inverse Density Importance Sampling,IDIS),其计算复杂度为 O ( N ) O(N) O(N),处理等量点云需要约 10 秒;随机采样的计算复杂度为 O ( 1 ) O(1) O(1),与数据量无关,处理等量点云需要约 0.004 秒;其他基于学习的采样方法或花费更多时间,或有更大的内存需求。
局部特征聚集
随机采样会丢失部分有用的信息,所以在丢失这些信息之前,先把信息收集起来。这部分可分为三步:局部空间编码(Local Spatial Encoding,LocSe)、下采样(Attentive Pooling) 和 残差模块。如图1所示。
局部特征编码
输入数据为 N × ( 3 + d ) N \times (3+d) N×(3+d) 的点云数据,其中 3 3 3 为点的空间坐标 ( x , y , z ) (x,y,z) (x,y,z), d d