遥感图像分类
一、背景简介
遥感图像分类就是利用计算机通过对遥感图像中各类地物的光谱信息和空间信息进行分析,选择特征,将图像中各个像元按照某种规则或算法划分不同的类别,然后获得遥感图像中与实际地物的对应信息,从而实现图像的分类。遥感图像计算机分类的依据是遥感图像像素的相似度。常使用距离和相关系数来衡量相似度。常见的分类方法有:监督分类、非监督分类法。
二、监督分类与非监督分类的区别及优缺点简要探讨:
案例:数据源为ENVI自带的Landsat tm5数据Can-tmr.img,类别为:林地、草地/灌木、耕地、裸地、沙地、其它六类。 下面就分别用监督分类与非监督分类法次此案例进行简单分析。
首先我们来了解一下什么是监督分类?
监督分类是用于在数据集中根据用户定义的训练样本类别聚集像元。训练样本类别是像元的集合或单一波谱。在分类过程中,可以选择它们作为代表区域或分类素材。
监督分类的大致步骤有:类别定义、样本选择、分类器选择、影像分类、分类后处理、结果验证。
监督分类对本案例处理的简要流程:
1、类别定义
根据分类目的、影像数据自身的特征和分类区收集的信息确定分类系统;对影像进行特征判断,评价图像质量,决定是否需要进行影像增强等预处理。这个过程主要是一个目视查看的过程,为后面样本的选择打下基础。本例是以ENVI自带Landsat tm5数据Can-tmr.img为数据源,类别分为:林地、草地/灌木、耕地、裸地、沙地、其他六类。
2、样本选择
为了建立分类函数,需要对每一类别选取一定数目的样本,在ENVI,中是通过感兴趣区来确定,也可以将矢量文件转化为ROIs文件来获得,或者利用终端像元收集器来获得。本例中使用ROIs方法,打开分类图像,在Display->Overlay->Region of Interest,默认ROIs为多边形,按照默认设置在影像上定义训练样本。如图1-1示,设置好颜色和类别名称。
如图1-1 训练样本的选择
3、分类器选择
根据分类的复杂度,精度需求等确定哪一种分类器。目前监督分类可分为基于传统统计分析学的,包括平行六面体、最小距离、马氏距离、最大似然,基于神经网络的,基于模式识别,包括支持向量机、模糊分类等,针对高光谱有光谱角,光谱信息散度,二进制编码。
4、影像分类
选择支持向量机分类方法。主菜单下选择Classification>Supervised>Support Vector Machine。按照默认设置参数输出分类结果。如图1-2:
图1-2支持向量机分类器参数设置
图1-3支持向量机分类结果
5、分类后处理
分类后处理包括的很多过程都是可选项,包括更改类别颜色、分类后统计,小斑块处理等。如更给类别颜色:在主图像窗口中的显示菜单里,选择Display > Color Mapping > Class Color Mapping,分别选取颜色。
图1-4类别颜色更改后的效果
图1-5自动颜色更改的效果
6、结果验证
结果验证主要是对分类结果进行评价,确定分类的精度和可靠性。有两种方法:一是混淆矩阵,二是ROC曲线。在此不作具体介绍。
让我们来了解一下什么是非监督分类?
非监督分类:也称为聚类分析或点群分类。在多光谱图像中搜寻、定义其自 然相似光谱集群的过程。它不必对影像地物获取先验知识,仅依靠影像上不同类地物光谱(或纹理)信息进行特征提取,再统计特征的差别来达到分类的目的,最后对已分出的各个类别的实际属性进行确认。
目前非监督分类器比较常用的是ISODATA、K-MEAN 等链状方法。
非监督分类处理本案例的流程简要:
1、影像分析
大体上判断主要地物的类别数量。一般监督分类设置分类数目比最终分类数量要多2-3倍为宜,这样有助于提高分类精度。本案例的数据源为ENVI自带的 Landsat tm5 数据Can-tmr.img, 类别分为:林地、草地/灌木、耕地、裸地、沙 地、其它六类。
2、分类器选择
ISODATA重复自组织数据分析技术,计算数据空间中均匀分布的类均值,然后用最小距离技术将剩余像元进行迭代聚合,每次迭代都重新计算均值,且根据所得的新均值,对像元进行再分类。
K-MEAN使用了聚类分析方法,随机地查找聚类簇的聚类相似度相近,即中心位置,是利用各聚类中心对象的均值所获得一个中心对象来进行计算的,然后迭代地重新配置它们,完成分类过程。
3、影像分类
打开ENVI,选择主菜单->Classificatio->Unsupervised->IsoData或者K-mean。如选择IsoData,在选择文件时,可以设置空间或光谱裁剪区。如选择Can-tmr.ing,按默认设置,之后跳出参数设置,如图1-6:ISODATA非监督分类结果。
1-6分类结果
4、 类别定义
在display中显示原始影像,在display->overlay->classification,选择ISODATA分类结果,如图所示,在Interactive Class Tool面板中,可以选择 各个分类结果显示。如图1-7:
图1-7影像与分类结果的叠加
Interactive Class Tool面板中,选择Option->Edit class colors/names。 通过目视或者其他方式识别分类结果,填写相应的类型名称和颜色。如图1-8所 示为最终结果。
图1-8类别定义结果
5、分类后处理
对颜色的分类,统计分析等参考监督分类。
6、 结果验证
参照监督分类
三、小结
由此案例可得监督分类与非监督分类:
区别:非监督分类的关键部分是类别定义。此过程需要数据的支持,甚至需要组织野外实地调查。
监督分类中的样本选择和分类器的选择较关键。在样本选择时,为了更加清楚的查看地物类型,可以适当的对图像做一些增强处理。
两者的根本区别是在于是否利用训练场地来获取先验的类别知识。
优缺点:
优点:可充分利用分类地区的先验知识,预先确定分类的类别;可控制训练样本的选择;可避免非监督分类中对光谱集群组的重新归类等。
缺点:人为主观因素较强;训练样本的选取和评估需花费较多的人力,时间等。
非监督分类:
优点:无需对分类区域有广泛的了解,仅需一定的知识来解释分类出集群组;人为误差小;独特的,覆盖量小的类别均能被识别;简单,速度快等。
缺点:对其结果进行大量处理后,才能得到可靠分类结果;不能精确控制分类的类别数等。