RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds
本文介绍一篇cvpr2020里面关于大场景下点云分割的文章。
论文
代码
1. 问题
为了解决的问题很直接,超大规模的点云分割
2. 思想
网络架构如上,本文花了大量的时间论述针对超大规模的点云场景,目前只能使用随机采样这种快速的采样方法。 对比部分可以详见论文。
为了与随机采样这种方法相适应,作者相应的提出了Dilated Residual Block 模块作为基本单元,其中又包括Local Spatial Encoding 和 Attentive Pooling
3. 算法
3.1 Local Spatial Encoding
也叫做point enrichment, 以点的坐标为基础,增加描述的属性,比较常见的操作。
3.2 Attentive Pooling
不使用maxpooling这种比较简单的聚合操作
4 实验结果
在各个分割的数据集上表现都很棒,另一个关键优点是快!
总结
文章做的很棒,为了可以处理大规模舍弃了一些东西。
有几个关键trick值得注意:
1 knn的index是直接计算好的,仅根据x,y,z。
2 随机采样的时候有一个 local maxpooling的操作,论文中似乎没有提到。
3 充分的实验,在各个数据集上表现都很棒。
4 这些贡献在分类任务上不能算是优点,但是在大规模的分割任务下就具有优越性了。