高光谱遥感影像分类研究进展 --- (15年论文,方法主要是常规处理,但是写的比较细)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/u012193416/article/details/79310863

论文地址

高光谱遥感影像分类研究进展

南大、矿大、河海

15年的文章比较老,科普文,但是理论总结和语言用词都比较扎实

 

在总结分类策略的基础上,重点从以核方法(SVM)为代表的新型分类器设计、特征挖掘、空间-光谱分类、基于主动学习和半监督学习的分类、基于稀疏表达的分类、多分类器集成6个方面对高光谱影像像素级分类最新研究进行了综述。

 

研究方向:大数据、引入机器学习领域新理论、利用多源遥感数据、多维特征空间互补的优势

 

1.引言

高光谱遥感是指具有高光谱分辨率的遥感数据获取、处理、分析和应用的科学技术,通常采用覆盖一定波谱范围的成像光谱仪非成像光谱仪两种传感器获取数据,利用大量窄波段电磁波获取感兴趣目标的理化信息。
成像光谱仪:在电磁波谱的紫外、可见光、近红外和中红外区域,获得大量光谱连续且光谱分辨率较高的图像数据(数据立方体)

非成像光谱仪直接获取观测点连续的光谱数据

 

2.高光谱遥感影像分类策略

高光谱的特点:

(1)特征空间维数高,数据相关性强,冗余度高,运算时间长。

(2)要求的训练样本多。

(3)可用于分类的特征多,既包括直接光谱向量,还可以计算植被指数、光谱吸收指数、倒数光谱、文理特征、形状指数等派生特征。

(4)图像的二阶统计特征在识别中的重要性增加。

 

目前高光谱遥感影像分类采用的策略主要包括:

(1)以训练样本为依据的监督分类与非监督分类

(2)以分类特征输入为依据的分类策略

(3)以像元构成假设为前提的硬分类和软分类

(4)以基本操作单元为基础的像素级分类和对象级分类

(5)以分类器数量为区分准则的单分类器和多分类器集成(刚看过的一篇文章)

 

高维特征数,有效样本数,会出现分类精度随特征维数上升而下降的Hughes现象。

怎么办?

传统方案是选择波段和特征提取进行降维处理,将原始数据压缩到低维空间。

近两年的方法(2015年的方法)

1.发展适用于小样本、高维特征的分类器,如SVM

2.半监督分类,在已知类别标记的训练样本不足的情况下,讲位置类别的样本引入训练过程

 

分类采用的特征判据来看:

(1)直接利用原始高光谱数据分类,将待分类光谱与参考光谱按照一定相似度量准则进行分析。

(2)按照一定准则选择若干降维后的分量作为分类判据进行分类

(3)丛原始数据中提取其他特征(如形态学剖面、文理特征等空间特征),或引入辅助数据,综合采用多维特征分类。(卷积神经网络就是这个套路)

 

硬分类:将遥感影像中的每一个像素都赋予一个单一类别,划分依据是像素特征(光谱特征、文理特征或多种混合特征)与已知各类别统计特征的相似性。

软分类:根据像素对应地表范围往往由多个类别地物组成的实际情况,假设每个像素都可能属于多个类别或有多个类别组成,按照特定的算法计算像素与各个类别的关系,分类输出是该像素属于每一类别的概率、或者每一类被地物在该像素中的比例。

前者给出的是固定的像素的标签,后者是一个概率,用softmax出来的都是相应类别的概率值。

 

从以像素作为基本操作单元向面向对象的影像分类过渡。

卷积神经网络的滑窗大小就是面向对象的分类,在每个滑窗上的扫描还是单个像素的,最后的分类也是基于单个像素的,但是考虑到了在滑窗中的空间因素。

 

多分类器:信息互补


 

3.高光谱影像分类的挑战与进展

(1)维数灾难的挑战。特定的分类器和训练样本条件下,高光谱影像的分类精度会随着特征维数的增大而呈现先增后减的趋势,分类器的泛化能力会随着维数的增大而变弱。

(2)非线性数据结构的挑战。信号的高维特性、不确定性、信号冗余以及地表物体的异质性等导致了高光谱数据的高度非线性,一些基于统计模式识别理论的分类模型难以直接对原始高维数据进行分类识别。

(3)不适定问题的挑战。在统计学习中,由于已标记样本有限和样本质量不均一,统计模型往往不足以表达高光谱影像的数据分布,模型参数无法估计或估计不准确。(适定问题,解是唯一的,存在的,稳定的)

(4)空间同质性和异质问题的挑战。真实地表物体的分布呈现区域性,相邻位置通常代表相同的物体,然而逐像素分类结果往往事与愿违。

 

解决办法:

(1)核变换技术:   解决复杂非线性数据结构问题(将重叠严重和非线性的光谱数据进行高维映射之后在计算,高维就不重叠了,这种高维映射需要一个核函数)

(2)特征挖掘技术:能够找出有效特征集,就是在数据上进行一定的特征提取,利用特征进行分类,避免高维特征带来的维度灾难。

(3)半监督学习和主动学习用于高光谱影像分类

(4)光谱-空间分类:利用光谱和空间特征,很好的解决高光谱分类中空间同质性和异质性的问题。

(5)稀疏表达:将高维信号表达成少数字典原子及其系数的线性组合,在去噪的同时发掘数据本源并对其进行有效表征,传递字典原子的类别信息,依据最小重构误差可实现较准确的信号分类。

(6)多分类器集成:可以解决单一分类器泛化性能差、选择分类器主观性强等问题。

 

3.1新型分类器的引入与应用

SVM

人工免疫系统AIS(武大 钟燕飞)

多项式逻辑回归 MLR  (卷积神经网络处理遥感影像最后一层基本都是逻辑回归LR)


人工神经网络

 

3.2 面向高光谱遥感影像分类的特征挖掘

特征挖掘旨在降低数据维数,在一个低维空间中对高光谱数据进行分类,以减弱分类的‘不适定问题’,根据是否改变原始光谱空间,包括特征提取和波段选择。

特征提取通过一定的数学模型将若干波段组合为低维的几个特征。在特征提取方法中,知识引导的特征提取基于对光谱特征的理解对相关波段进行数学运算以获取深层次信息;然而,专家知识往往很难得到,因此发展了诸多基于统计的特征提取算法,关键在于如何构建合适的变换矩阵。

波段选择的目的在于从原始波段集合中选择若干波段构成一个子集,使得后续分析的性能高于或不低于使用原始全部波段得到的结果。其特点就在于保留了各个波段的物理特性。波段选择的关键在于定义何种测度指标作为目标函数。

封装型波段选择方法则是利用一个给定分类器的分类性能进行波段选择。

滤波器性波段选择方法采用一个独立于后续分类器的信息测度作为目标函数,卷积核本质上也是滤波器。方法相对较多,可以分为监督波段和非监督波段选择。

 

监督波段选择方法:

利用训练样本信息构建目标函数,参数型方法是带有变化参数的,应该是随着波段选择的特征提取性能变化而变化的。

 

除了构建合适的信息测度函数外,使用何种搜索策略也会对后续的分类结果产生重要的影响。一般有3中搜索策略:

1.穷尽搜索

2.贪心算法

3.启发式搜索

 

特征挖掘技术集中于:

特征提取

波段选择的核心问题是:寻找有效的搜索策略和评价标准。

特征提取将特征空间从高维变到低维,并用少数特征代表原始数据,需要计算数据的统计特征,计算复杂度较高。

波段选择是寻找某个子集来代表原始数据,一定程度上丢掉了部分信息。

 

3.3  半监督学习(SSL)和主动学习(AL)的分类应用


主动学习的核心问题就是设计启发式的样本选择方法

SSL和AL都是通过样本的充分利用来改善分类的‘不适定’问题,SSL更重视样本数量对分类模型的优化,而AL则更重视样本质量对分类模型性能的提升。

 

3.4 光谱-空间分类

核心问题在于如何提取文理、形状、对象、语义等空间信息,以及如何有效的将光谱信息与空间特征相结合。(空间特征提取目前主流2D-CNN,空谱提取3D-CNN)

 

按照处理思路分为同步处理和后处理:

同步处理策略将提取到的空间特征和光谱特征一起输入分类器得到分类结果。这种处理方式涉及特征融合的问题,通常可采用简单堆栈的方式(串行方式)或特征叠加的方式(并行方式)。串行方式将极大增加数据维数和计算复杂度,同时也会使分类过程进一步陷入不适定问题。(对于特征提取本身而言,多采用串行,比如多模型集成,并行的话,多在于空谱联合这种,特征图叠加。类似于图层叠加,当然我也看过空间和光谱特征直接串行的)

后处理策略是先获得基于像素的初始分类结果,然后利用图像分割方法对原始分类结果进行逐对象的正则化处理,以得到空间同质度较高的分类图。

 



 

3.5 稀疏表示与字典学习的应用

稀疏表示将原始高维信息用尽可能少的非零稀疏及其对应的字典原子来线性表示,大大简化了信号处理过程。同时,信号的稀疏编码过程传递了原子的类别标记信息,为高光谱影像分类开闭了一个崭新的途径。


1.利用HSI数据构造字典,借助稀疏表达得到稀疏系数,以稀疏系数和光谱信息训练随机森林,并利用投票得到最终分类结果。

2.构建结构化字典,建立基于稀疏表示的高光谱影像分类模型,并添加空间相关性约束来提高分类精度。


3.6 多分类器集成的应用

多分类器系统通过对分类器集合中的基分类器进行选择和组合,能够获取比任何单一分类器更高的精度。

确定系统结构:

并行结构:直接利用某种策略综合多个单分类器分类结果,目前高光谱分类中的主流结构

串行结构:将前一层的分类结果(类别标签或概率)作为后一层的输入。支持向量机、决策树。BP神经网络、最小距离分类器和最大似然分类器的输出作为第二层支持向量机的输入。 怎么没见过啊,分类器输出的值还能进入下一个分类器,输入shape不对?

混合结构:并行结构和串行结构的综合

 

选择基分类器构造方式:

(1)基于不同样本的构造方式。基于相同的训练集,采用不同的抽样技术得到不同的输入训练样本,常见算法如Bagging和AdaBoost。


(2)基于不同特征集的构造方式。但该构造方式强调对同一训练集的不同特征表达,典型的是随机森林。

首先根据波段相似性将所有波段划分为若干组,然后对每一组利用支持向量进行分类,最后将所有各组的输出采用一个额外的支持向量机。

(3)基于不同数量分类器的构造方式。在多分类器系统中,一般选择全部生成的基分类器或其子集进行组合生成最终分类结果。由于高光谱烟感影像的复杂性,基分类器在不同样本区域的分类效果具有差异性,这对分类结果会产生一定的影响,需要利用一些先验知识或者统计知识加以调整。

 

这回策略:投票法、贝叶斯平均法、统计意见一致法、证据理论和模糊积分法。

 

4.结论

发展趋势:

(1)新型的分类器与分类算法

(2)多特征综合、多数据融合、多尺度复合

(3)泛化能力强的分类方法

 

思考的问题:

(1)将高光谱遥感影像作为一种典型的高维数据集、小样本情况下能够获取高精度的分类算法,而对应你分类结果是够有滴血解释、分了过程中采用的特征是否有滴血意义、分类算法是否有可能得到实际应用,却缺乏足够的重视。

(2)发展特定应用相关的分类算法。

(3)合理的数据源选择

(4)大数据 + 深度模型 + 高光谱

(5)分类技术与智能观测系统相结合。高性能计算和并行处理。

 


展开阅读全文

没有更多推荐了,返回首页