【论文阅读】- 2017-A Convolutional Neural Network-Based 3D Semantic Labeling Method for ALS Point Clouds

30 篇文章 6 订阅
15 篇文章 0 订阅

A Convolutional Neural Network-Based 3D Semantic Labeling Method for ALS Point Clouds

  • Zhishuang Yang, Wanshou Jiang ,*ID , Bo XuID , Quansheng Zhu , San JiangID and Wei Huang

  • State Key Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing,

Abstract

现存的语义分割方法都依赖于大量的特征以及邻域点之间的相互作用,无法发挥他们的潜力。本文提出一个基于CNN的提取高级特征的方法。提出一种将3d点云邻域的特征转化为2d图像的方法。首先,在一个窗口内对每一个点提取他们的局部几何特征、全局几何特征、全波形特征并把特征转为2D图像。然后使用这个生成的图像作为CNN的输入,实现3D语义分割的任务。最后使用ISPRS的数据集进行评估,OverAll可达到82.3。

1. Introduction

简单介绍之前的机器学习方法,机器学习方法最大的缺点就是不考虑邻域点的label信息(上下文信息)独立地对每一个点进行分类。因此引入了MRF和CRF以获得各类之间的依赖。

我们提出了一种根据单点生成特征图像的方法。使用局部几何特征、全局几何特征、全波形特征从邻域点生成特征图像。

2. Methodology

工作流程

首先,我们将点的分类转换为相应特征图像的分类。然后训练。最后使用模型进行分类。在这里插入图片描述

2.1 CNN

在这里插入图片描述

完整的公式如下,

卷积
在这里插入图片描述

全连接
在这里插入图片描述

2.2 Feature Image Generation

将点云分成128*128个cell,计算每一个cell的中心坐标。

对每一个cell的中心坐标给定一个固定的半径r,查找其邻域,在其邻域内计算局部几何特征,包括平面性、各向同性、以及法向量和垂直方向之间的角度方差。

使用软件包SCOP++生成DTM并计算Height above.(应该是归一化高程),使用该特征可以区分道路和房顶。

使用全波形雷达特征中的回波强度特征。(The chosen echo intensity values are high on building roofs, on gravels roads, and on cars, while low values are asphalt roads and tar streets [6], which makes these objects easy to distinguish.)

再计算以上特征后,根据特征计算三通道值,

在这里插入图片描述

对每一个cell,将根据三通道值赋予颜色rgb,开始的square window就变成了128*128的图像。
在这里插入图片描述
这样点的空间语义信息就借助于三种特征转变为了一个图像。CNN模型通过这些有限的低级特征图像提取高级表示。

2.3 Accuracy Evaluation

在这里插入图片描述
在这里插入图片描述

3. Experimental Result

3.1 Dataset

ISPRS 3D数据集。 contains the spatial XYZ-coordinates, intensity values,the number of returns, and the reference labels.

3.2. Experiments
  • 对于每一类的点的数量差距过大,进行了class re-balancing

  • The batch gradient descent with a batch size of 128 examples, base learning rate of 0.01,momentum of 0.9, and weight decay of 0.0005 to estimate the CNN parameters is used for training。

  • 用5个features和set the width of cell 0.05 m来考虑不同半径的球状邻域的影响

在这里插入图片描述

  • 用5个features和set the neighborhood radius to 1 m来考虑cell width 的影响

在这里插入图片描述

  • 最后,选择radius = 1,cell width = 0.05m来考虑5个特征的影响。

不同的选择如下图,

在这里插入图片描述

对应的结果如下表,

在这里插入图片描述

最终的CNN_DEIV方法分类结果如下,

在这里插入图片描述

  • We use all five features and set the neighborhood radius to 1 m, set the cell width to 0.05 m, and then change the training samples

不同选择如下图,

在这里插入图片描述
结果如下表,

在这里插入图片描述

3.3 ISPRS Benchmark Testing Results

不同结果的分类结果如下表,

在这里插入图片描述

4. Discussion

There are three main parameters in our work: the neighborhood radius, the cell width, and the feature selection.

分析了各个参数的选择过程,发现我们方法的效果很大程度上依赖于DTM的质量(Thus, we may state that the performance of the proposed method depends significantly on the quality of the DTM).

我们的方法效果很好( overall accuracy of our method is ranked 1st, average F1 of the five main categories is ranked 2nd),并且我们的方法仅仅使用了5个特征。另外,特征的数量可能导致了一些误分类(the low quantities of the features may lead to some misclassifications,such as the powerline, fence/hedge and shrubs have relatively low F1 scores.)。选择一些其他特征(高程方差、回波特征、点密度、hierarchical features )或者在邻域选择阶段采用基于熵最大化的方法(eigen-entropy maximization)可能会提高精度。

在我们的框架中,一些非常接近的点会有相同的特征图。尽管考虑了点的空间相关性但仍有一些误分类的点。对每一个点生成特征图耗时、耗资源,可以参考 Guninard [39] [Weakly supervised segmentation-aided classification of urban scenes from 3D lidar point clouds] ,采用一种pre-segmentation的方法减少计算负担。该方法应对了噪声并且减少了特征图的数量。

5. Conclusions

从邻域选择、增加特征、采用segment-based method三个方面提出了改进,以提高精度,减少计算负担。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: simam是一种简单的、无需参数的注意力模块,用于卷积神经网络。它可以帮助网络更好地捕捉输入数据中的重要信息,提高模型的性能。simam的设计简单,不需要额外的参数,可以方便地集成到现有的卷积神经网络中。 ### 回答2: SimAM(简单、无需参数的注意力模块)是一种卷积神经网络的注意力机制,旨在显著提高图像分类和物体检测任务的性能。这个模块可以自适应地学习到不同层的特征,并对其进行加权,以便更好地捕获相关信息并抑制噪声。 SimAM模块的核心思想是将一组特征向量传递到一个简单的多头自注意力层,以便为不同特征之间的联系评分,并生成那些较为重要的特征向量,这些向量随后用于后续的网络计算中。具体来说,SimAM模块将输入特征张量分为若干个通道,并将每个通道作为输入,送入多头自注意力层。该层是由若干个子层堆叠而成的,其中每个子层都包括一个多头自注意力机制和一些前向反馈层。自注意力机制可以捕捉到输入特征张量内部各个通道之间的关系,并生成相应的权重矩阵。前向反馈层可以帮助模型更好地适应各种难以预测的数据。 SimAM模块与传统的注意力机制相比,具有以下优点: 1.不需要额外的参数:SimAM模块不需要任何额外的参数,仅仅依靠了平移不变性和自注意力机制即可提取图像特征。 2.易于训练:模块中的每个子层都具有非常简单的结构,可以很容易地进行训练和调整参数。 3.高效:SimAM模块的计算成本低,且可以与传统的卷积神经网络结构相结合,以提高图像分类或物体检测的精度。 总之,SimAM模块是一种非常优秀的注意力机制,具有简单而有效的设计,可用于各种计算机视觉应用中。相信随着更多研究人员的关注,SimAM模块会在未来得到更多的应用和发展。 ### 回答3: Simam是一种简单的、无参数的卷积神经网络注意力模块,它能够提高卷积神经网路的性能。该模块的主要目的是为了实现对卷积层特征的自适应加权,从而优化卷积神经网络的训练过程。 在卷积神经网络中,每个卷积层都会生成一系列特征图,这些特征图可以被看作是卷积层对输入图像的不同抽取方式。在经过多层的卷积操作后,这些特征图逐渐变得抽象和复杂,也变得更具有区分度。然而,由于不同的特征图的质量和作用是不同的,因此,需要一种方法来自适应地对它们进行加权,以便提高整个网络的性能。 Simam模块的核心思想是使用特定的权重来实现对特征图进行加权。这些权重的计算不需要任何参数,而是通过应用一些简单的非线性映射来实现的。具体来说,Simam模块会对特征图进行归一化,然后通过一些非线性函数(如ReLU)进行变换,最终得到一个类似于置信度的分数,从而决定特征图的相对重要性。 在使用Simam模块的卷积神经网络中,该模块被添加在卷积层之后,可以作为一种自适应加权机制来对特征图进行加权。这种机制能够更加准确地区分每个特征图的质量和作用,从而提高整个卷积神经网络的性能。 总之,Simam模块是一种简单而有效的自适应加权机制,可以提高卷积神经网络的性能。在实际应用中,它可以被广泛应用于图像分类、物体检测、语义分割等领域,从而提高计算机视觉的精度和效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Tech沉思录

点赞加投币,感谢您的资瓷~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值