基于PCA和SVM的高光谱遥感图像分类研究

  本文选自《基于PCA和SVM的高光谱遥感图像分类研究 》–张亮,感觉对一些概念了解的还行但是和实际结合就有点犯晕了,做部分整理,强调理解。
  摘 要:由于高光谱图像波段数目多,各波段间具有较强的相关性,因此通过主成分分析(PCA)方法对高光谱数据进行预处理,达到了降维的目的,同时也去除了噪声波段。用支持向量机方法对高光谱遥感图像进行分类,可实现图像的分类识别。

1 引 言

  高光谱遥感图像分类方法在处理高维数据方面存在一定不足。一方面由于高光谱遥感影像中存在的不确定性,参加波段越多,不确定性的影响也就越大;另一方面则是所谓Hughes现象,即在训练样本固定时,分类精度随特征维数的增加而下降,而样本的获取在高光谱分类中往往是一项比较困难的工作,特别是采用高维特征向量时要求每类的样本数都要比特征维数高。因此在高维信息处理中的精度与效率和高光谱遥感信息精细光谱与大数据量之间就产生了极大的矛盾,如何协调和解决这种矛盾成为分类中一个急需解决的问题。

2 基于PCA和SVM的高光谱遥感图像分类

2.1 主成分分析(PCA):PCA(Principal Components Analysis)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集对方差贡献最大的特征
主成分分析法的计算步骤
1)对资料阵X=这里写图片描述标准化得这里写图片描述,其中
这里写图片描述
这里写图片描述
(2)求出相关矩阵
这里写图片描述
这里写图片描述
式中i为标本编号,这里写图片描述。其中,这里写图片描述
(3)求出R的特征值及特征向量
令| R- λIp|= 0,得p个特征值λi,i= 1,2,… ,p
(4)求出主成分
将求出的特征值按大小依次排列,使得λ1> λ2> … >λp,根据≥ 85%原则确定m,并依次排列特征向量u1,u2,… ,um,就可得出我们所需的主成分。
2.2 支持向量机
持向量机的基本思想是寻找一个分类超平面,使得训练样本中的两类样本能被分开
2.3 基于PCA和SVM的高光谱遥感影像分类流程
这里写图片描述
基于PCA和SVM的高光谱遥感影像分类流程图
分类步骤:
(1)实验数据为1992年6月拍摄的印第安纳西北部农业区220波段的AVIRIS高光谱航空影像。光谱分辨率和空间分辨率分别为10nm和20m。选取的影像大小为145×145。图中主要包含各类农作物和林地、草地等植被类型在内的16个地物类别。考虑到主要的研究目的,仅选取了玉米,植被,干草,大豆,小麦5个类别进行分类实验。由于波段数较多,有些波段质量不佳,同时为了克服Hughes现象,利用PCA变换进行波段优选,达到优化数据、去除噪声和数据降维的目的。

(2)训练样本和测试样本处理过程:根据现有的遥感资料,将待分类地区分为玉米,植被,干草,大豆,小麦5类,选择各类型的训练样本和测试样本,为了避免一些特征值范围过大或过小、计算核函数时计算内积引起数值计算的困难,对训练样本和测试样本进行规一化

(3)SVM训练过程:为了克服分类精度受参数的影响,根据高光谱数据的特点及上述详细的理论分析,我们选择径向基核函数,将训练样本映射到高维特征空间,利用SVM在样本特征空间中找出各类别特征样本与其它特征样本的最优分类超平面,得到代表各样本特征的支持向量集及其相应的VC可信度,形成判断各特征类别的判别函数和训练模型

(4)SVM决策过程:将测试样本通过核函数作用映射到特征空间中,作为判别函数的输入,对之进行测试。

(5)分类结果:利用OAO分类算法进行分类,得到分类结果图。

3 分类实验及结果评价

3.1 数据处理
  实验数据为1992年6月拍摄的印第安纳西北部农业区220波段的AVIRIS高光谱航空影像。光谱分辨率和空间分辨率分别为10nm和20m。选取的影像大小为145× 145。图中主要包含各类农作物和林地、草地等植被类型在内的16个地物类别。考虑到主要的研究目的,仅选取了玉米,植被,干草,大豆,小麦5个类别进行分类实验。在220波段的图像数据中,有一部分波段受到了噪声和水气的干扰,图像分辨率较差,因此,首先要把这些坏波段移除。计算相邻两波段的相关系数,如果它们的相关系数小于0.8,则认为这两个波段是坏波段。经过处理后,剩余186个波段。图3中分别为受到噪声干扰较严重的波段和噪声比较小的波段。
在剩余的186波段中,使用PCA进行降维处理。首先每一个波段的数(145× 145)转化为一个向量(1× 21025)。然后将186维波段数据整合成一个新的矩阵X(186×21025)。将X(186× 21025)标准化,得到新的A(186×21025),再求出相关矩阵R(186× 186),然后再计算R的186个特征值,并由大到小排列,最后对应的排列特征向量,就完成了主成分的分析。通过对贡献率的排序,以及这里写图片描述原则,前10个主成分的贡献率达到了94%,在下面的分类中就选择前10个主成分的波段进行实验。
3.2 分类实验
  降维后的数据图像,将每一维数据转化为一个向量,即将145× 145的矩阵每一行数据移到前一行之后,构成1× 21025的向量。因此,降维后的10维数据即成为一个新的矩阵I,大小为5× 21025。训练时选取了6类样本,分别为玉米,植被,干草,大豆,小麦以及人工建筑。在选取样本时,分别选取反应每一类样本光谱特点的图像中较亮的部分,如图4所示。
这里写图片描述
这里写图片描述
图4(a)至图4(f)中白色较亮部分依次表示玉米,植被,干草,大豆,小麦以及人工建筑较明显的区域。在选取了各图中较明亮部分作为训练样本后,经过支持向量机训练,被分成了6类,分别定义为1— 6。
3.3 测试输出
  降维后的10维波段数据,即数据矩阵I,作为输入进行测试。通过支持向量机决策之后,每个列向量,即每个像素点在不同波段的数据所构成的向量,被判别为样本训练后的其中一类。于是,产生了一个结果矩阵Y,大小是1× 21025,每一个列向量分别对应原图像的一个像素点,该像素点经过支持向量机决策后,产生1- 6的6种结果之一。将Y矩阵重新转化成145× 145的新结果矩阵Yd。在Yd中,将1- 6六种数据分别加以不同的颜色,描绘出新的图像,如图5所示。可与伪彩色图对比(图6)。
  对比图7和图5可以发现,186个波段分类结果更显清晰。由此可见,降维处理能够选择出一些信息量比较大、代表性强的特征,但也有许多有用、重要的信息被损失了
这里写图片描述这里写图片描述
3.4 结果评价
  评价的标准是地面真实的参考图,如图8所示。其中各部分代表的种类为:因为只对玉米,植被,干草,大豆,小麦这5个种类作出评价,所以忽略图中的空白部分以及这5种以外的部分。降维后的5个波段分类结果经过逐个点的判断,得出分类混淆矩阵,如表1所示。这里写图片描述
  另外,在不降维的情况下对图像进行分类,即186个波段数据全部作为测试样本输入,得到的分类结果如表2所示。
这里写图片描述 
  从表中可以看出,植被,干草,小麦三类的分类精度较高,而玉米和大豆这两种种类发生一定的混淆。由于实验图像的摄取时间为1992年6月,此时,玉米正处于生长发育的早期,其光谱特征与其它有叶植物(如大豆)非常接近,导致部分待分样本类别类间光谱均值差异不明显。而玉米和大豆在图中又占了比较大的比例,因此,各种类的精度经过加权平均后,总体精度略微偏低。对比表1和表2,186波段的分类精度要低于降维后5波段的分类精度
4 结 论
  本文在分析高光谱遥感影像分类的现状及遇到困难的基础上,提出了利用主成分分析法进行去除噪声和特征提取,从而达到优化数据、克服Hughes现象、提高分类精度和速度的目的;利用支持向量机分类法对特征缩减的影像进行分类,从而克服传统分类方法在高光谱分类中的一些缺陷。以AVIRIS高光谱数据为实验数据,通过理论分析和传统分类方法的对比实验,结果表明了本文提出的方法用于高光谱遥感影像分类的实用性和优越性。如果加上纹理和地形等其它特征,利用本方法进行分类,可望得到更好的分类效果。

相关推荐
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页