ENVI系列教程(十二)——遥感图像监督分类

目录

1 概述

2 详细操作步骤

2.1 第一步:类别定义 / 特征判别

2.2 第二步:样本选择

2.3 第三步:分类器选择

2.4 第四步:影像分类

2.5 第五步:分类后处理

2.6 第六步:精度验证


1 概述

监督分类,又称训练分类法,用被确认类别的样本像元去识别其他未知类别像元的过程。它就是在分类之前通过目视判读和野外调查,对遥感图像上某些样区中影像地物的类别属性有了先验知识,对每一种类别选取一定数量的训练样本,计算机计算每种训练样区的统计或其他信息,同时用这些种子类别对判决函数进行训练,使其符合于对各种子类别分类的要求,随后用训练好的判决函数去对其他待分数据进行分类。使每个像元和训练样本作比较,按不同的规则将其划分到和其最相似的样本类,以此完成对整个图像的分类。

遥感影像的监督分类一般包括以下 6 个步骤,如下图所示:

监督分类步骤

本教程以 Landsat tm5 数据 Can_tmr.img 为数据源,数据存放在 “11. 遥感图像监督分类” 文件夹中,学习 ENVI 中的监督分类过程。

2 详细操作步骤

2.1 第一步:类别定义 / 特征判别

根据分类目的、影像数据自身的特征和分类区收集的信息确定分类系统;对影像进行特征判断,评价图像质量,决定是否需要进行影像增强等预处理。这个过程主要是一个目视查看的过程,为后面样本的选择打下基础。

启动 ENVI5.1,打开待分类数据:can_tmr.img。以 R:TM Band 5,G:TM Band 4,B:TM Band 3 波段组合显示。

通过目视可分辨六类地物:林地、草地 / 灌木、耕地、裸地、沙地、其他六类。

RGB三波段合成的数据结果

2.2 第二步:样本选择

(1)在图层管理器 Layer Manager 中,can_tmr.img 图层上右键,选择 “New Region Of Interest”,打开 Region of Interest (ROI) Tool 面板,下面学习利用选择样本。

  • 在 Region of Interest (ROI) Tool 面板上,设置以下参数:
  1. ROI Name:林地
  2. ROI Color: (0,153,0)
Region of Interest (ROI) Tool 面板上设置样本参数
  • 默认 ROIs 绘制类型为多边形,在影像上辨别林地区域并单击鼠标左键开始绘制多边形样本,一个多边形绘制结束后,双击鼠标左键或者点击鼠标右键,选择 Complete and Accept Polygon,完成一个多边形样本的选择;
  1. 同样方法,在图像别的区域绘制其他样本,样本尽量均匀分布在整个图像上;
  2. 这样就为林地选好了训练样本。

注:1、如果要对某个样本进行编辑,可将鼠标移到样本上点击右键,选择 Edit record 是修改样本,点击 Delete record 是删除样本。2、一个样本 ROI 里面可以包含 n 个多边形或者其他形状的记录(record)。3、如果不小心关闭了 Region of Interest (ROI) Tool 面板,可在图层管理器 Layer Manager 上的某一类样本(感兴趣区)双击鼠标。

(2)在图像上右键选择 New ROI,或者在 Region of Interest (ROI) Tool 面板上,选择新建ROI工具。重复 “林地” 样本选择的方法,分别为草地 / 灌木、耕地、裸地、沙地、其他 5 类选择样本。

(3)如下图为选好的样本。

训练样本的选择

(4)计算样本的可分离性。在 Region of Interest (ROI) Tool 面板上,选择 Option>Compute ROI Separability,在 Choose ROIs 面板,将几类样本都打勾,点击 OK。

打开计算ROI可分离度工具
选择所有样本并点击确定

(5)表示各个样本类型之间的可分离性,用 Jeffries-Matusita, Transformed Divergence 参数表示,这两个参数的值在 0~2.0 之间,大于 1.9 说明样本之间可分离性好,属于合格样本;小于 1.8,需要编辑样本或者重新选择样本;小于 1,考虑将两类样本合成一类样本。

ROI可分离度计算结果

注:1、在图层管理器 Layer Manager 中,可以选择需要修改的训练样本。2、在 Region of Interest (ROI) Tool 面板上,选择 Options > Merge (Union/Intersection) ROIs,在 Merge ROIs 面板中,选择需要合并的类别,勾选 Delete Input ROIs。

合并ROIs
新的ROI可分离度报告

(4)在图层管理器中,选择 Region of interest ,点击右键,save as,保存为.xml 格式的样本文件。

注:1、早期版本的感兴趣文件格式为.roi,新版本的为.xml,新版本完全兼容.roi 文件,在 Region of Interest (ROI) Tool 面板上,选择 File>Open 打开.xml 或.roi 文件。2、新版本的.xml 样本文件(感兴趣区文件)可以通过,File>Export>Export to Classic 菜单保存为.roi 文件。

保存ROI文件

2.3 第三步:分类器选择

根据分类的复杂度、精度需求等确定哪一种分类器。目前 ENVI 的监督分类可分为基于传统统计分析学的,包括平行六面体、最小距离、马氏距离、最大似然,基于神经网络的,基于模式识别,包括支持向量机、模糊分类等,针对高光谱有波谱角(SAM),光谱信息散度,二进制编码。下面是几种分类器的简单描述。

  • 平行六面体(Parallelepiped)

根据训练样本的亮度值形成一个 n 维的平行六面体数据空间,其他像元的光谱值如果落在平行六面体任何一个训练样本所对应的区域,就被划分其对应的类别中。

  • 最小距离(Minimum Distance)

利用训练样本数据计算出每一类的均值向量和标准差向量,然后以均值向量作为该类在特征空间中的中心位置,计算输入图像中每个像元到各类中心的距离,到哪一类中心的距离最小,该像元就归入到哪一类。

  • 马氏距离(Mahalanobis Distance)

计算输入图像到各训练样本的协方差距离(一种有效的计算两个未知样本集的相似度的方法),最终技术协方差距离最小的,即为此类别。

  • 最大似然(Maximum Likelihood)

假设每一个波段的每一类统计都呈正态分布,计算给定像元属于某一训练样本的似然度,像元最终被归并到似然度最大的一类当中。

  • 神经网络(Neural Net)

指用计算机模拟人脑的结构,用许多小的处理单元模拟生物的神经元,用算法实现人脑的识别、记忆、思考过程。

  • 支持向量机(Support Vector Machine)

支持向量机分类(Support Vector Machine 或 SVM)是一种建立在统计学习理论(Statistical Learning Theory 或 SLT)基础上的机器学习方法。SVM 可以自动寻找那些对分类有较大区分能力的支持向量,由此构造出分类器,可以将类与类之间的间隔最大化,因而有较好的推广性和较高的分类准确率。

  • 波谱角(Spectral Angle Mapper)

它是在 N 维空间将像元与参照波谱进行匹配,通过计算波谱间的相似度,之后对波谱之间相似度进行角度的对比,较小的角度表示更大的相似度。

  • ……

2.4 第四步:影像分类

基于传统统计分析的分类方法参数设置比较简单,在 Toolbox/Classification/Supervised Classification 能找到相应的分类方法。这里选择支持向量机分类方法,在 toolbox 中选择 /Classification/Supervised Classification/Support Vector Machine Classification,选择待分类影像,点击 OK,按照默认设置参数输出分类结果。

选择需要分类的图像
支持向量机分类参数设置
支持向量机分类结果

2.5 第五步:分类后处理

包括更改类别颜色、分类后统计、小斑块处理、栅矢转换等,这部分另外专门有一个教程讲解,在此不做叙述。

2.6 第六步:精度验证

对分类结果进行评价,确定分类的精度和可靠性。有两种方式用于精度验证:一是混淆矩阵,二是 ROC 曲线,比较常用的为混淆矩阵,ROC 曲线可以用图形的方式表达分类精度,比较抽象。

真实参考源可以使用两种方式:一是标准的分类图,二是选择的感兴趣区(验证样本区)。两种方式的选择都可以通过主菜单 ->Classification->Post Classification->Confusion Matrix 或者 ROC Curves 来选择。

真实的感兴趣区验证样本的选择可以是在高分辨率影像上选择,也可以是野外实地调查获取,原则是获取的类别参考源的真实性。由于没有更高分辨率的数据源,本例中就把原分类的 TM 影像当作是高分辨率影像,在上面进行目视解译得到真实参考源。

(1)在 Data Manager 中,分类样本上右键选择 Close,将分类样本从软件中移除。

(2)直接利用 ROI 工具,跟分类样本选择的方法一样,即重复第二步,在 TM 图上选择 6 类验证样本。

注:可直接 File>open,打开 can_tm - 验证样本.roi。

验证样本分布示意图

(3)在 Toolbox 中,选择 / Classification/Post Classification/Confusion Matrix Using Ground Truth ROIs,选择分类结果,软件会根据分类代码自动匹配,如不正确可以手动更改。点击 OK 后选择报表的表示方法(像素和百分比),点击 OK,就可以得到精度报表。

搜索并打开相应的工具
选择分类结果
参数设置
勾选像素和百分比
SVM分类精度评价混淆矩阵

下面对混淆矩阵中的几项评价指标进行说明:

  • 总体分类精度

总体分类精度等于被正确分类的像元总和除以总像元数。被正确分类的像元数目沿着混淆矩阵的对角线分布,总像元数等于所有真实参考源的像元总数。

  • Kappa 系数

它是通过把所有真实参考的像元总数(N)乘以混淆矩阵对角线(Xₖₖ)的和,再减去某一类中真实参考像元数与该类中被分类像元总数之积之后,再除以像元总数的平方减去某一类中真实参考像元总数与该类中被分类像元总数之积对所有类别求和的结果。

  • 错分误差

错分误差指被分为用户感兴趣的类,而实际属于另一类的像元,它显示在混淆矩阵里面。比如林地有 419 个真实参考像元,其中正确分类 265,12 个是其他类别错分为林地(混淆矩阵中林地一行其他类的总和),那么其错分误差为 12/419=2.9%。

  • 漏分误差

漏分误差指本身属于地表真实分类,当没有被分类器分到相应类别中的像元数。比如耕地类有真实参考像元 465 个,其中 462 个正确分类,其余 3 个被错分为其余类(混淆矩阵中耕地类中一列里其他类的总和),漏分误差为 3/465=0.6%

  • 制图精度

制图精度是指分类器将整个影像的像元正确分为 A 类的像元数(对角线值)与 A 类真实参考总数(混淆矩阵中 A 类列的总和)的比率。比如林地有 419 个真实参考像元,其中 265 个正确分类,因此林地的制图精度是 265/419=63.25%。

  • 用户精度

用户精度是指正确分到 A 类的像元总数(对角线值)与分类器将整个影像的像元分为 A 类的像元总数(混淆矩阵中 A 类行的总和)比率。比如林地有 265 个正确分类,总共划分为林地的有 277,所以林地的用户精度是 265/277=95.67%。

注:监督分类中的样本选择和分类器的选择比较关键。在样本选择时,为了更加清楚的查看地物类型,可以适当的对图像做一些增强处理,如主成分分析、最小噪声变换、波段组合等操作,便于样本的选择;分类器的选择需要根据数据源和影像的质量来选择,比如支持向量机对高分辨率、四个波段的影像效果比较好。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

@HNUSTer_CUMTBer

你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值