点云数据是LiDAR的主要数据,尤其是早期的LiDAR数据处理都是针对点云数据进行的。机载LiDAR激光脚点的分布是按照时间序列进行采样和存储的,其在地面上的分布不是规则的,其空间分布呈现为离散的数据“点云”。这些点中,有些点位于真实地形表面上,有些位于不同的地物上(房屋、管线、烟囱等),还有些落在植被上(数木、灌木、草)等。
激光脚点分布
LiDAR点云数据中信息的分类提取,即点云数据的分类工作在整个 LiDAR数据后处理过程中占 60%-80%的工作量,但目前还没有一种全能的方法能有效的提取复杂地形中的各种信息。且现有的分类算法的具体操作细节也由于版权问题极少公开,这也增加了分类算法研究的难度。机载LiDAR数据采集具有一定的盲目性,激光脚点的位置是随机的,不能保证地形特征点和地物特征点能有数据,这给激光脚点性质的判别带来了很大的困难,使机载LiDAR数据的分类很困难。
LiDAR点云数据的分类可分为一级分类和二级分类,一级分类主要指区分地面点和地物点,而二级分类是指在一级分类的基础上对地物点集的再分类,主要分类类别包括有植被、建筑物、道路信息和电力线等等。一般的分类方法还停留在一级分类上。
国外 LiDAR点云的分类算法的研究起步较早,发展的分类方法理论基础主要分成四类:基于坡度理论的分类方法、最小区域分类方法、基于面理论的分类方法和聚类/分割算法。
1、坡度理论
计算相异的两点间的坡度值或高差,当这个坡度值或高差超过设定的阈值时,就认为其中的较高点就是地物点(如图 2-27(a)所示)。这种理论的基础是假设陡坡只会出现在地物数据集中。
2、最小区域理论
设定一个水平面,并在其垂直方向上设置一定区域作为缓冲区,包含在这个三维缓冲区域内的点都划为地面点集(如图2-27(b)所示)。
3、面理论
不同于最小区域理论,面理论选择的面是一个由参数计算的不规则的面,在面上也设定一个缓冲区,包含在这个三维缓冲区域内的点划为地面点集(如图 2-27(c)所示)。
4、聚类/分割算法
用周围邻近区点域进行分类时,聚类/分割算法的理论依据是一个类中所有的点共同来描述一个完整的物体,而非物体中单独的面(如图2-27(d)所示)。聚类算法是由 Filin(2002) 和 Roggero(2002)提出,分割算法是由 Lee, Schenk 和 Sithole(2002)提出。
目前基于面理论的分类方法使用得最广泛。依据模拟近似地面方法的不同,可以再将分类方法细分为两种:
1、内插的分类方法
线性加权最小二乘内插模拟近似地面(Kraus and Pfeifer,1999), 计算点到初始模拟面的高差。通常情况下,地物点到初始模拟面的高差为正,而地面点到初始模拟面的高差则为负。在重新计算近似地面时,正高差的权较小,甚至为负;负高差将获取较大的权,甚至接近 1。将分级的概念融合到内插中可以得到一种新的分类方法(Pfeifer et al,2001)。进一步改进,用标准化最小二乘取代最小二乘得到另外一种新方法,但此方法需要预先获取一些参数的值(Lee 和 Younan, 2003)。
2、基于数学形态学原理的分类方法
利用数学形态学的操作运算来获取近似地面,如开运算。数学形态学的方法从概念上来讲,是简单易操作的。只要激光点云数据分辨率足够好,开运算就能有效地剔除地面物信息。如果数据分辨率太低,就需要较大的操作窗口来提出地物信息,相应的一些地面突出特征也会被抹平(Qi Chen,2007)。
图2-27 国外分类方法的分类原理示意图
(a)坡度理论;(b) 最小区域理论;© 面理论;(d) 聚类/分割理论
[参考文献] 王丽英. 机载LiDAR数据误差处理理论与方法[M]. 测绘出版社, 2013