目录
8)、联合特征数量及分割尺度的多空间分辨率影像植被类型识别分析
第一章 高分遥感图像分类概述
1、遥感图像分类概念与内涵
1)、数字图像处理的三个层次
2)、图像处理技术分类的三种基本范畴
- 低级处理:图像获取、预处理,不需要智能
- 中级处理:图像分割、表示与描述,需要智能
- 高级处理:图像识别、解释,缺少理论,为降低难度,设计的更专用
3)、遥感最终目的
遥感的最终目的是描绘、反映、量化地球表面的格局,进而理解和把握地球表面各种现象和过程。
4)、遥感分类定义
遥感图像分类以遥感数字图像为研究对象,在计算机系统的支持下,综合运用地学分析、遥感图像处理、地理信息系统、模式识别与人工智能等技术,实现地学专题信息的智能化获取。
其基本目标是将人工目视解译遥感图像发展为计算机支持下的遥感图像理解。
5)、遥感分类意义
- 利用遥感图像可以客观、真实和快速地获取地球表层信息,这些现势性很强的遥感数据在自然资源调查与评价、环境监测、自然灾害评估与军事侦察上具有广泛应用前景。
- 利用计算机进行遥感图像智能化解译,快速获取地表不同专题信息,并利用这些专题信息迅速地更新地理数据库,这是实现遥感图像自动理解的基础研究之一。
notes:
现势性是指某个事物或现象在当前的情况下所具有的性质、特点或状态。
6)、遥感分类原理
- 计算机遥感图像分类是统计模式识别技术在遥感领域中的具体应用。统计模式识别的关键是提取待识别模式的一组统计特征值,然后按照一定准则做出决策,从而对遥感图像予以识别。
- 遥感图像分类的主要依据是地物的光谱特征等,即地物电磁波辐射的测量值,这些测量值可以用作遥感图像分类的原始特征变量。然而,就某些特定地物的分类而言,多波段影像的原始亮度值并不能很好地表达类别特征,因此需要对数字图像进行运算处理(如比值处理、差值处理、主成分变换以及K-T变换等),以寻找能有效描述地物类别特征的模式变量,然后利用这些特征变量对数字图像进行分类,大致区分遥感图像中多种地物的目的。
- 根据计算机系统分类过程中人工参与程度通常将遥感影像分类方法分为监督分类和非监督分类两种。
- 遥感图像分类常使用距离和相关系数来衡量相似度。采用距离衡量相似度时,距离越小,相似度越大。采用相关系数衡量相似度时,相关程度越大,相似度越大。
2、遥感图像分类的技术发展
1)、遥感分类方法概述
- 非监督分类法:假定遥感图像上同类物体在同样条件下具有相同的光谱信息特征。在没有先验类别(训练场地)作为样本的条件下,即事先不知道类别特征,主要根据统计性判别准则,以像元间相似度的大小进行归类合并(即相似度的像元归为一类)的方法。
- 监督分类法:选择具有代表已知地面覆盖类型的训练样本区,用训练样本区中已知地面各类地物样本的光谱特性来“训练”计算机,获得识别各类地物的判别函数或模式(如均值、方差、判别域等),并以此对未知地区的像元进行分类处理,分别归入到已知具有最大相似度的类别中。
- 新的探索:机器学习(浅层神经网络、深层神经网络等)
2)、监督/非监督分类方法比较
- 根本区别点在于是否利用训练样区来获取先验的类别知识。
- 监督分类根据训练样区提供的样本选择特征参数,建立判别函数,对待分类点进行分类。因此,训练样本选择是监督分类的关键。
- 相比之下,非监督分类不需要更多的先验知识,它根据地物的光谱统计特性进行分类。因此,非监督分类方法简单,且分类具有一定的精度。严格说来,分类效果的好坏需要经过实际调查来检验。
notes:
- 当光谱特征类能够和唯一的地物类型(通常指水体、不同植被类型、土地利用类型、土壤类型等)相对应时,非监督分类可取得较好分类效果。
- 当两个地物类型对应的光谱特征类差异很小时,非监督分类效果不如监督分类效果好。
- 主成分PCA分析将多波段图像的所有信息降维成3个波段,防止信息过多造成过拟合。
3)、深度学习思想
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
深度学习是机器学习中一种基于对数据进行表征学习的方法。
深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。
4)、传统遥感图像分类中存在的问题
- 未充分利用遥感图像提供的多种信息
遥感数字图像计算机分类的依据是像素具有的多光谱特征,并没有考虑相邻像素间的关系。这种方法的主要缺陷在于地物识别与分类中没有利用到地物空间关系等方面的信息。
统计模式识别以像素作为识别的基本单元,未能利用图像中提供的形状和空间位置特征,其本质是地物光谱特征的分类。
图像分类后,可以利用分类的结果,将这些目标对象进行重组,在区域分割或边界跟踪的基础上抽取遥感图像形态、纹理特征和空间关系等特征,然后利用这些特征对图像进行解译。
- 提高遥感图像分类精度受到限制
正确率包括地物属性被正确识别,以及它们在空间分布的面积被准确度量。
大气状况的影响:
地物辐射电磁波,必须经过大气层才到达传感器,大气的吸收和散射会对目标地物的电磁波产生影响。
下垫面的影响:
下垫面的覆盖类型和起伏状态对分类具有一定影响。
其他因素的影响:
图像中的云朵会遮盖目标地物的电磁波辐射,影响图像分类。
多时相图像分类时,不同景的图像由于成像时光照条件的差别,同一地物电磁波辐射量存在差别,这也会对分类产生影响。
地物边界的多样性,使得判定类别的边界往往是困难的。
真实样本数量不够也会影响模型精度---小样本方法、元学习思想
3、高分辨率遥感图像分类理解
1)、载荷特色
- 精细:高空间分辨率、高光谱分辨率和高时间分辨率观测。
- 全面:全天候、全天时和全球观测。
- 高效:高空间分辨率同时宽覆盖,在提高空间分辨率的同时提高覆盖宽度,提高目标探测的效率。
- 新型:超光谱、多角度、偏振等探测手段提高了定量化探测的能力。
2)、分类的难点
- 遥感图像是从遥远的高空成像的,成像过程要受传感器、大气条件、太阳位置等多种因素的影响。影像中所提供的目标地物信息不仅不完全,而且或多或少地带有噪声,因此人们需要从不完全的信息中尽可能精确地提取出地表场景中感兴趣的目标物。
- 遥感影像信息量丰富,与一般的图像相比,其包容的内容远比普通的图像多,因而内容非常“拥挤”。不同地物间信息的相互影响与干扰使得要提取出感兴趣的目标变得非常困难。
- 遥感图像的地域性、季节性和不同成像方式更增加了计算机对遥感数字图像处理进行解译的难度。
- 高分辨率卫星遥感的发展,使得在较小的空间尺度上观察地表的细节变化、进行大比例尺遥感制图以及监测人为活动对环境的影响成为可能。
3)、高分辨率遥感图像分类理解
- 空间分辨率的提高,光谱混淆,细节明显
- 光谱分辨率的提高,维数灾难
4、遥感图像分类技术和主要流程
1)、遥感分类基本流程
- 明确遥感图像分类的目的及其需要解决的问题,选择所需遥感图像。
- 根据研究区域,收集相关数据,对图像进行辐射校正和几何纠正。
- 选择合适的图像分类方法和算法。根据应用目的及图像数据特征制定分类系统。
- 代表这些类别的统计特征。
- 测定总体特征。
- 遥感图像中各像素进行分类。
- 分类精度检验。
- 对判别分析的结果统计检验。
2)、训练样区的选择
- 准确性:确保选择的样区与实际地物的一致性
- 代表性:考虑到地物本身的复杂性,所以必须在一定程度上反映同类地物光谱特性的波动情况
- 统计性:选择的训练样区内必须有足够多的像元
3)、遥感影像特征提取
图像识别中的特征降维和特征选择是统计模式识别的一个基本问题,其目的是从大量特征中选择用于分类、预测的最优特征子集。在监督分类中如果不进行特征选择,可能会引起维数灾难问题。
维数灾难:随着特征维数的增加,训练样本数目必须以指数级的数量进行增长,否则可能会导致分类精度降低。此外,无关或噪声特征加入分类过程不仅影响分类精度,而且降低分类效率。
随着特征维度的增加,会带来较多问题:
- 维度增加时,数据的计算量增大,运算速度会变慢,这样在实际应用中的时效性较难满足;
- 一些特定的地物或者类型不需要较多的维数就可以完全和其他类型的地物区分开,太多的特征反而可能会降低这些地物分类的精度;
- 受分类器本身的限制,使得分类的特征维数并不能任意的高,太高的维度也会降低分类的精度。
光谱特征
纹理特征
纹理是图像上颜色变化及其组合所形成的空间格局。
几何特征
- 矩形度:物体的矩形度指物体的面积与其最小外接矩形的面积之比值。
- 宽长比:指物体的最小外接矩形的宽与长之比值。
- 球状性:圆形度包括周长平方面积比、边界能量、圆形性、面积与平均距离平方之比值等。
- 圆形度:圆形度是指物体的形状是否接近圆形的程度。
- 不变矩:常见的不变矩包括中心矩、规范化中心矩、伽玛不变矩等。这些不变矩可以用于描述物体的位置、尺度、形状等特征,并且对噪声和变形具有一定的鲁棒性。
- 偏心率:偏心率又称为伸长度,它是区域形状的 一种重要描述方法。偏心率在一定程度上反映了一个区域的紧凑性。一种常用的计算方法是区域长轴(主轴)长度与短轴(辅轴)长度的比值。
形状特征
对物体进行描述时,有时希望能使用一些比单个参数提供更丰富的细节,而又比用图像本身更紧凑的方法来描述物体的形状,这就是形状描述子,它可以对物体形状进行简洁的描述。
- 傅立叶描述子
- 拓扑描述
- 边界链码
- 一阶差分链码
多时相光谱特征
4)、遥感图像分类方法
SVM分类算法
- SVM是一种基于统计学理论的机器学习方法
- 目标:找到一个超平面,使得它尽可能多的将两类数据点正确的分开,同时使分开的两类数据点距离分类面最远。
- 解决方法:构造一个在约束条件下的优化问题,具体的说是一个受限的二次规划问题,求解该问题,得到分类器。
- SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。
面向对象分类算法
面向对象分类算法是一种利用面向对象的编程思想来实现分类任务的算法。在面向对象编程中,将实体对象抽象为类,每个类具有一组属性和方法。面向对象分类算法将分类任务看作是在特征空间中寻找最优的类边界,通过定义类的特征和类的方法,来实现对样本的分类。
- 成群像素构成有意义的对象
- 利用邻近信息
- 同时利用多重比例尺信息
面向对象的高级分类
对象特征:
- 颜色
- 形状
- 纹理
- 层次
类间相关特征:
- 与邻近对象
- 与子对象
- 与父对象
类结构:
- 继承类的描述
- 基于图像对象知识
- 等级类结构
优势:
- 可明确表达复杂的分类
- 类分组
- 易定义关系
- 可转成其他图像
面向对象分类与识别
- 基于光谱特征的分类提取
- 基于时间序列的分类提取
- 基于多特征的分类提取
5)、分类后处理
无论是监督分类还是非监督分类,其结果都会产生一些面积很小的图斑。无论从专题制图的角度还是实际应用的角度,都有必要对这些小图斑进行剔除。
处理方法:
- 聚类统计
- 过滤分析
- 去除分析
- 分类重编码
6)、分类精度检查
- 在监督分类中把已知的训练数据及分类类别与分类结果进行比较,确认分类的精度及可靠性。
- 在非监督分类中,采用随机抽样方法,分类效果的好坏需经实际检验或利用分类区域的调查材料、专题图进行核查。
- 误差矩阵的评价。
- 漏判误差=1-生产者准确度
- 误判误差=1-使用者精确度
- Kappa指标:表示分类结果比随机分类好多少的指标。Kappa指标考虑到两种一致性的差异,一是自动分类和参考数据间的一致性,另一种是取样和参考分类的一致性机率。一般而言,Kappa介于0~1之间,Kappa值越大表示分类精度越高。
- ROC曲线:是一种显示分类模型在所有分类阈值下的效果的图表。
5、面向大数据应用的分类设计
1)、特征样本库构建
大尺度遥感土地利用分类应用中的地域差异表现
- 异物同谱,同谱异物现象的增多
- 不同地域的气象条件
- 同级分类标准中的地物的地域的光谱差异
“不同”载荷也对地物目标的识别与分类影响较大
- 不同卫星载荷
- 同一载荷的不同时期
2)、样本特征库构建意义
- 特征样本库的建立将大大方便高效地提高基于遥感卫星数据的地物识别能力。
- 首先,对于全国区域,可以通过中国自然区划方案以及行政区划的叠加来决定样本的提取和选择方案。
- 其次,建立标准的样本库。(样本库主要分布于不同时相,不同代表性区域内。当分类系统输入图像数据后,通过数据本身的所在区域以及获取时间,获得该空间位置处的地表覆盖类型,时相信息不同,同一空间位置的样本所指覆盖类型可能不一样)。
3)、样本特征库建立技术路线
4)、遥感图像特征
光谱特征提取
- 原始特征:各波段光谱响应;
- 变换特征:KL,KT,HIS等;
- 谱间特征:植被指数;建筑指数;水体指数;
5)、遥感瓦片定义
遥感瓦片数据是对原始数据进行几何、辐射等预处理后形成 干净准确的影像,在对其按照标准分辨率层级进行重采样,最后为保证定量化处理精度按标准格网裁切成1000x1000的规格化影像。
6)、遥感分类与目标检测技术框架
- 以GIAS为操作平台,由GIAS平台组织数据、建立任务、整合结果;
- 以瓦片方式,做所有的承载工作,和数据库系统对接;
- 流程化处理,需求输入-任务订单-生产节点-结果反馈;
- 支持大数据分析、机器学习算法、集群并行、GPU加速等。
- 通过规格化处理,传统一景为单位的数据形成了一系列的瓦片数据,具有时空特性,具有分布式数据库系统和并行处理系统优势。
- 方便数据的管理和使用,通过一套瓦片体系具有标准化的样本集、处理数据集和产品集;
- 可以降低规格化数据的存储稳定性,利用分布式规格化数据存储站点的计算资源,实现数据本地计算和直接在线服务,提高系统效率。
第二章 遥感图像分类工程及处理基础
1、遥感图像预处理技术
图像变换
- 彩色图像变换
- KT变换
- KL变换
- 傅里叶变换
- 小波变换
- 多尺度几何分析
图像增强
- 点运算
- 空间域滤波
- 频率域滤波
- 彩色增强
1)、彩色图像变换
- 彩色变化又称为彩色编码,所谓彩色变换即为两种彩色模型编码系统之间的变换。
- 彩色模型指的是某个三维彩色空间的一个可见光子集。它包含某个彩色域的所有彩色,彩色模型的用途是在某个彩色域内方便地指定彩色。由于任何一个彩色都只是可见光的子集,所以任何一个彩色模型都无法包含所有的可见光。
RGB-IHS变换
RGB-IHS变换是一种颜色空间转换方法,用于将RGB颜色空间转换为IHS颜色空间。IHS表示亮度(Intensity)、色调(Hue)和饱和度(Saturation)。
- I-代表彩色光的亮度
- H-颜色色纯的程度
- S-色彩纯洁性
RGB颜色空间由红色、绿色和蓝色三个通道组成,每个通道的取值范围是0到255。而IHS颜色空间将颜色的表示分为亮度、色调和饱和度三个分量。
IHS编码的优点是能把强度和颜色区分开。
RGB-YUV变换
RGB-YUV变换是一种颜色空间转换方法,用于将RGB颜色空间转换为YUV颜色空间。YUV颜色空间由亮度(Y)和色度(U、V)三个分量组成。
RGB颜色空间是由红、绿、蓝三个颜色通道组成,每个通道的取值范围是0到255。而YUV颜色空间则是将颜色的表示分为亮度和色度两个分量,其中亮度(Y)表示图像的明暗程度,而色度(U、V)则表示图像的颜色信息。
2)、K-T变换(缨帽变换)
Kauth和Thomas通过对陆地卫星MSS图像反映农作物和植被的生长过程的研究发现,MSS图像信息随时间变化的空间分布形态是呈规律性变化,它像一个顶部有缨子的毡帽,即植被信息的波谱数据点随时间变换的轨迹是一个缨帽,且具有较明显的三维结构,而缨帽的底面恰好反映了土壤信息的数据特征,称为土壤面,其与植被的波谱特征互不相关。
缨帽变换可以通过将不同时间点的植被波谱数据点进行分析和比较来构建。首先,需要获取植被的波谱数据,可以使用遥感技术获取植被的光谱反射率或辐射值等信息。然后,将不同时间点的波谱数据点绘制在同一张图上,其中时间作为自变量,波谱数据点的数值作为因变量。最后,通过连接这些数据点,可以得到一个随时间变化的波谱轨迹,形状类似于一个缨帽。
3)、K-L变换
由于遥感图像的不同波段之间往往存在着很高的相关性,从直观上看,就是不同波段的图像很相似。因此从提取有用信息的角度考虑,有相当大的一部分数据是多余和重复的。K-L变换的目的就是把原来多波段图像中的有用信息集中到数据尽可能少的新主成分图像中,并使这些主成分图像之间互不相关,也就是说各个主成分包含的信息内容是不重叠的,从而大大减少总的数据量并使图像信息得到增强。---主成分分析PCA
K-L变换是统计特征基础上的多维(如多波段)正交线性变换。
K-L变换,也称为Karhunen-Loève变换,是一种信号处理和数据分析中常用的线性变换方法。它可以将原始数据转换为一组新的正交基向量,使得转换后的数据具有最大的方差。这些新的基向量称为K-L变换的特征向量,对应的特征值表示原始数据在对应特征向量方向上的方差大小。
K-L变换的应用广泛,其中一个重要的应用就是在图像处理中。通过对图像进行K-L变换,可以将图像转换为一组新的特征向量,其中每个特征向量代表图像中的一个特征。这些特征可以用于图像压缩、图像恢复、图像分类等任务。
notes:
性质和特点
- K-L变换是正交线性变换,所以变换前后的方差总和不变,变换只是把原来的方差不等量的再分配到新的主成分图像中;
- 第一主成分包含了总方差的绝大部分(一般在80%以上),也就是说K-L变换的结果使得第一主成分几乎包含了原来多波段图像信息的绝大部分,即信息量最大,其余各主成分的方差依次减少,因此后面的主成分所包含的信息量也剧减;
- 第一主成分相当于原来各波段的加权和,而且每个波段的加权值与该波段的方差大小成正比(方差大说明该波段图像所包含的信息量大,在第一主成分中占的比重大),反映了地物总的反射强度。
图像处理中的作用
- K-L变换是图像分析与模式识别中的重要工具,用于特征抽取,降低特征数据的维数;
- K-L变换用于图像压缩时可以实现有损压缩和无损压缩;
- K-L变换后的N幅图像统计上互不相关,因此K-L变换可以去除图像数据的相关性,提取主要信息。
4)、傅立叶变换
- 在连续信号的分析中,傅立叶变换为人们深入理解和分析各种信号的性质提供了一种强有力的手段。
- 傅立叶变换的实质是将图像函数展开成具有不同空间频率的正余弦函数的线性组合,将空间域的图像数据变换到频率域后,能够对图像数据实施不同频率成分的提取。
- 它是建立在所处理的信号是平稳信号的假设基础上。一般来说,一个复杂的连续平稳信号总是可以分解为许多简单的正、余弦信号的叠加。
- 图像可以看成是一个平稳的随机场,因此我们可以将图像信号进行傅立叶变换以便进行进一步的分析和处理。
- 傅立叶变换将图像灰度值形成的空间域与其频率域联系起来,它起到了一种桥梁的作用,并使得图像处理的分析者在解决某一问题时会在空间域和频率域来回切换。
- 对频谱图象中的各种频率成分进行有针对性的分析和处理,可以实现图像的进一步滤波处理。如进行低通滤波或者高通滤波。
5)、小波变换
小波变换是一种信号的时间-尺度(时间-频域)分析方法,它具有多分辨率分析的特点,而且在时频两域都具有表征信号局部特征的能力,是一种窗口大小固定不变但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法。即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率。这正好符合低频信号变化缓慢而高频信号变化迅速的特点。
6)、多尺度几何分析
好的图像表示方法
- 多尺度:能够对图像从粗尺度到细尺度进行连续逼近,即带通性;
- 局域性:在空域和频域,这种方法的基应该是局部的;
- 临界采样:要求表示方法的基所带来的数据冗余度要小;
- 方向性:基应该具有许多方向,随尺度加细方向应该增多;
- 各向异性:基的支撑区间应随方向不同呈现长宽比不同的长条状。
7)、点运算
点运算是把图像中的每一像元值,按照特定的数学变换模式转换成输出图像的一个新的亮度值。
灰度变换法
- 线性变换
- 对数变换
- 指数变换
直方图调整法
- 直方图均衡化
- 直方图匹配
8)、空间域滤波
- 空间卷积运算
- 图像平滑
- 平均值滤波
- 中值滤波
- 图像锐化
- 微分法
notes:
-
空间卷积运算:空间卷积运算是一种基本的图像处理操作,它通过将图像与一个滤波器进行卷积运算来改变图像的特征。卷积运算可以用于图像平滑、边缘检测、特征提取等任务。
-
图像平滑:图像平滑是一种降低图像噪声和纹理细节的方法,以获得更加平滑的图像。平滑操作可以通过卷积运算来实现。常用的平滑方法包括均值滤波和高斯滤波。均值滤波是一种简单的平滑方法,它通过计算像素周围邻域的平均值来平滑图像。
-
均值滤波:均值滤波是一种常用的图像平滑方法,它通过计算像素周围邻域的平均值来替代当前像素值。均值滤波可以有效地去除高频噪声,但可能会导致图像细节的模糊。
-
中值滤波:中值滤波是一种非线性滤波方法,它通过对像素值进行排序,并选择中间值作为当前像素的新值。中值滤波对于椒盐噪声和其他离群值的抑制效果较好,同时能够保留图像的边缘信息。
-
图像锐化:图像锐化是一种增强图像边缘和细节的方法。常用的图像锐化方法包括拉普拉斯算子和梯度算子。图像锐化可以增强图像的边缘和细节,但可能会增强噪声。
-
微分法:微分法是一种基于图像梯度的边缘检测和细节增强方法。通过计算图像的一阶或二阶导数,可以提取出图像中的边缘信息。常用的微分算子有Sobel算子和Laplacian算子。微分法对于边缘和细节有很好的响应,但对于噪声敏感,可能会放大噪声。
9)、频率域滤波
频率低通滤波法
低通滤波器:
- 理想低通滤波器(ILPF)
- 巴特沃思低通滤波器(BLPF)
- 指数形低通滤波器(ELPF)
- 梯形低通滤波器(TLPF)
频率高通滤波法
高通滤波器:
- 理想高通滤波器
- 巴特沃思高通滤波器
- 指数形高通滤波器
- 梯形高通滤波器
同态滤波
- 图像在密度域中的处理有时会比在亮度域中的处理效果更好,因为人的视觉系统对图像亮度的响应具有类似于对数运算的非线性形式。
- 若物体受到照度明暗不均的时候,图像上对应照度暗的部分,其细节就难辨别。
- 同态滤波的目的:消除不均匀照度的影响而又不损失图像细节。
10)、彩色增强
- 伪彩色处理:根据一定准则给灰度值赋予彩色值的处理方法。
- 假彩色处理:把真实的自然彩色图像或遥感多波段图像处理成彩色图像的过程。
伪彩色处理
- 灰度分层法:把灰度图像的灰度级分成若干层次,在每个层次上赋予颜色,则可以得到图像的伪彩色图像。
- 灰度变换法:基本思想是利用像素的灰度值来确定该像素在彩色图像中的颜色。
notes:
遥感图像处理单波段彩色增强的意义:区分出地物的类别。
假彩色处理
- 真彩色:红通道-R(红光波段),绿通道-G(绿光波段),蓝通道-B(蓝光波段)
- 标准假彩色:红通道-IR(近红波段),绿通道-R(红光波段),蓝通道-G(绿光波段)
用途:
- 景物映射成奇异彩色,比本色更引人注目。
- 适应人眼对颜色的灵敏度,提高鉴别能力。如人眼对绿色亮度响应最敏感,可把细小物体映射成绿色。人眼对 蓝光的强弱对比灵敏度最大。可把细节丰富的物体映射成深浅与亮度不一的蓝色。
- 遥感多光谱图像处理成假彩色,以获得更多信息。
2、典型图像分类器
1)、图像分割
图像分割是将一副图像分割为空间上连续的、互不重叠的并具有同质性的区域,称为对象。在图像分析过程中,一幅图像内被成多个图像对象,这些对象组成图像对象层,而对象层用作图像分析的内部工作区域。在图像分析过程中,一般采用多尺度分割,产生多个图像对象层,并位于基础像元层之上,两个或多个构成一个图像对象层次。
2)、遥感图像分类
目的:利用多波段遥感图像像元的相似性或在特征空间的聚集位置,寻找一种对像元进行归并或划分的方法,实现图像分类
条件:
- 非监督分类:对待分类图像无先验知识,即不知类中心
条件下的分类方法,如K均值、模糊C均值、ISODATA
- 监督分类:对待分类图像有先验知识,即能确定类中心
条件下的分类方法,如最小距离法、最大似然法、支持向量机
方法:
- 非监督分类:利用特征空间
中像元的聚集位置寻找类中心
- 监督分类:通过样本的训练获得类中心
,根据各像元与类中心
的相似性对
进行划分,使得
,且
,
,
(
个种类)
分水岭变换
- 创造性地把图像梯度当作是三维地形(DEM)来处理
重点考虑三种类型的点:
- 局部的最小值点
- 把水放在某点的位置上,水会下落到特定的某个最小值点
- 把水放在某点的位置上,水会等概率地流向不止一个这样的最小值点
- 满足条件2.的点的集合称为这个最小值的“汇水盆地”或“流域”
- 满足条件3.的点的集合组成地形表面的峰线,称为“分水线”
过程步骤为:
- 将图像看作三维地形
- 在每一个最小值点处打一个孔
- 以一致的速度从小孔向外涌水,并始终保持地形中所有水位一致
- 不同盆地的水相遇时则筑坝,并随着水位的不断升高,坝也升高
- 当水位达到地形的最高点时算法终止
- 这些大坝的边界对应汇水盆地的分割线,它们就是由分水岭算法提取出来的连续的边界线
- 分水岭变换以梯度值作为输入,以封闭的区域轮廓线作为输出
它结合了像元灰度值的不连续性和相似性两种特性,相对于其他分割方法存在的优点:
- 它能直接形成闭合且连通的区域,而基于边缘的分割技术往往得到不连通的边界,需要经过后处理生成闭合区域
- 它生成的区域边界与图像中对象的轮廓线基本是一致的
- 它生成的各区域的总和形成整幅图像
区域生长
- 根据事先定义的准则将像元或区域聚合成更大区域的过程
- 以一组种子点开始,将与其性质相似的相邻像元附加到种子点上
基本步骤:
- 选定种子点:自动或人机交互选定种子像元或种子区域
- 确定相似性准则:利用区域的灰度、颜色、纹理等同质性
- 生长:基于4连通或8连通邻域,对邻接像元或区域进行生长
- 终止:确定终止规则,生长结束
区域合并
遥感图像分类的区域合并是指将相邻的、属于同一类别的像素区域合并成更大的区域。这个过程可以通过以下步骤实现:
-
预处理:对遥感图像进行预处理,包括去除噪声、平滑图像等操作,以便提高分类的准确度。
-
初始分割:将遥感图像分割成小的像素区域,可以使用基于阈值、聚类等方法进行初始分割。
-
区域合并:根据一定的合并准则,将相邻的、属于同一类别的像素区域合并成更大的区域。常用的合并准则包括像素相似性、形状相似性、纹理相似性等。
-
迭代合并:重复进行区域合并操作,直到满足停止准则为止。停止准则可以是合并的次数达到预设值,或者合并后的区域数目不再发生变化。
-
后处理:对合并后的区域进行后处理,如去除不符合条件的区域、填补空洞等操作,以得到最终的分类结果。
最大似然分类
- 以单波段图像为例,分类的目的就是判断每个灰度级的类别归属。根据贝叶斯理论, 每个灰度级X对于各类别W的归属概率(后验概率)P(W|X),等于每个类别W中各灰度级出现的概率(似然度)P(X|W),乘以每个类别W出现的概率(先验概率)P(W),除以每个灰度级X出现的概率P(X)
- 其中,先验概率P(W)由各类别面积占全部面积的比例决定,是一个常数,可以利用专题图进行统计得到,在无先验信息的情况下可假设各类面积相同;而每个灰度级出现的概率P(X)是一个等概率事件,因此,后验概率P(W|X)主要由似然度P(X|W)决定(所以被称为最大似然法),即由各类别的概率密度函数决定
- 通常假设各类别服从正态分布(因此运用最大似然法进行分类应该对训练数据进行正态分布检验),根据训练数据获得各类别的均值、方差等统计量,基于高斯函数建立各类别的概率密度函数表达式,然后逐个灰度级判断哪个类别的概率密度函数最大,即将该灰度级分到该类别中,全部判别结束即得到分类结果
SVM分类
- SVM是一种基于统计学习理论的机器学习方法。
- 目标:找到一个超平面,使得它能够尽可能多的将两类数据点正确的分开,同时使分开的两类数据点距离分类面最远。
- 解决方法:构造一个在约束条件下的优化问题,具体地说是一个受限二次规划问题,求解该问题,得到分类器。
- 由于SVM的求解最后转化成二次规划问题的求解,因此SVM的解是全局唯一的最优解。
- SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。
SVM可以用于解决线性和非线性分类问题:
- 对于线性分类问题,SVM的目标是找到一个最优的超平面,能够最大化不同类别之间的间隔。超平面可以将数据点分成两个部分,分别对应两个不同的类别。
- 对于非线性分类问题,我们需要将数据点从原始的低维空间映射到更高维的空间,使得在高维空间中可以找到一个线性可分的超平面。这种映射可以通过核函数来实现。核函数能够将数据点从原始空间映射到另一个更高维的特征空间,并在该特征空间中进行线性分类。常用的核函数包括线性核、多项式核、高斯核等。
多分类的情况:
- 可以把k类问题转化为k个两类问题,其中第i个问题是用线性判别函数把属于
类与不属于
类的点分开。
- 更复杂一点的方法是用
个线性判别函数,把样本分为k个类别,每个线性判别函数只对其中的两个类别分类。
3)、实地数据采样定位方式
坐标信息
- RTK
- GPS
面信息
- 奥维地图
3、分类后处理技术
无论是监督分类还是非监督分类,其结果都会产生一些面积很小的图斑。无论从专题制图的角度还是实际应用的角度,都有必要对这些小图斑进行剔除。
1)、聚类统计(Clump)
- 通过对分类专题图像计算每个分类图斑的面积、记录相邻区域中最大图斑面积的分类值等操作,产生一个Clump类组输出图像,其中每个图斑都包含Clump类组属性。这是一个中间结果,供下一步处理使用。
2)、过滤分析(Sieve)
- 对经Clump处理后的Clump类组图像进行处理,按照定义的数值大小,删除Clump图像中较小的类组图斑,并给所有小图斑赋予新的属性值0。显然,这引出了一个小图斑归属问题。可以与原分类图对比确定新属性。
3)、去除分析(Eliminate)
- 用于删除原始分类图像中的小图斑或小Clump类组,与过滤不同,去除将删除的小图斑合并到相邻的最大分类中,而且如果输入图像是Clump聚类图像,经过去除处理后,将分类图斑的属性值自动恢复为Clump处理前的原始分类编码。即结果是简化的分类图像。
4)、分类重编码(Recode)
- 主要是针对非监督分类而言的,因在非监督分类过程中,用户一般要定义比最终需要多一定数量的分类数;在完全按照像元灰度值通过ISODATA聚类获得分类方案后,首先是将专题分类图像与原始图像对照,判断每个类别的专题属性,然后对相似或类似的分类通过图像重编码进行合并,并定义分类名称和颜色。
4、分类产品精度检验
1)、遥感图像分类精度检查
- 在监督分类中把已知的训练数据及分类类别与分类结果进行比较,确认分类的精度及可靠性。
- 在非监督分类中,采用随机抽样方法,分类效果的好坏需经实际检验或利用分类区域的调查材料、专题图进行核查。
2)、分类产品真实性检验
- 目标及检验卫星
- 测量仪器与人员
- 测量方案
- 实验区选择
- 样本采集
- 土地覆盖真值图地类标绘
- 预期数据量
- 预期检验产品
- 预期的数据应用
- 检验过程
- 检验报告
第三章 高分辨率遥感图像分类与识别
1、面向植被检测场景分类概述
1)、背景
- 植被是覆盖地表的植物群落的总称,是生态系统的主要成分;
- 植被覆盖度急剧减少,生态环境日益破坏,植被覆盖研究是热点,也是当务之急;
- 最早植被分类采用人工实地调查,成本高、周期长,投入大量人、财、物,存在主观性;
- 遥感影像空间分辨率、光谱分辨率不断提高,遥感智能处理技术发展迅速,大范围、高精度、低成本、多尺度、高时效、多样化植被分类研究成为可能。
2)、重点和难点
植被类型识别精度差强人意
植被景观的复杂性
- 尤其是南方植被,结构复杂,破碎度大,农田多插花种植
遥感观测的不确定性
- 航天遥感影像的空间分辨率相对较粗
- 受多云多雨影响,可用遥感影像资源相对不足
- 可以用于识别的特征偏少
分类技术的使用
- 多源遥感影像:光学/SAR(中分、高分、低分)
- 分类方法:最大似然法、神经网络、支持向量机、随机森林等
- 分类尺度:亚像元 <--像元--> 对象
3)、国内外研究现状
农业遥感应用
- 农作物播种面积检测
林业遥感应用
- 湿地遥感监测与评价
- 荒漠化监测与评价
植被检测
- 植被具有放氧、吸毒、除尘、杀菌、净化污水、减轻噪音、防止风沙、调节气候以及指示和检测环境污染等作用,是城市生态系统的调节器,对环境的净化具有重要作用。
4)、分类依据和原则
《土地利用现状分类》以服务国土资源管理为主,依据土地的自然属性、覆盖特征、利用方式、土地用途、经营特点及管理特性等因素。
训练样本
- 实地调查
- 官方数据
- 目视解译
实地调查
- 点数据--RTK、GPS
- 面数据--奥维地图
分类原则:
- 科学性原则:依据土地的自然和社会经济属性,运用土地管理科学及相关科学技术,采用多级续分法,对土地利用现状类型进行归纳、分类。
- 实用性原则:分类体系力求通俗易用、层次简明,易于判别,便于掌握和应用。
- 开放性原则:分类体系具有开放性、兼容性,既要满足一定时期管理及社会经济发展需要,同时又要满足进一步修改完善的需要。
- 继承性原则:借鉴和吸收国内外土地分类经验,对目前无争议或异议的分类直接继承和应用。
5)、分类基本框架
- 《土地利用现状分类》采用二级分类体系。一级类12个,二级类57个。
- 各省根据本省的具体情况,可在全国统一的二级分类基础上,根据从属关系续分三级类,并进行编码排列。但不能打乱全国统一的编码排序及其所代表的地类及含义。
一级类设定
- 依据土地用途和利用方式,考虑到农、林、水、交通等有关部门需求,设定“耕地”、“园地”、“林地”、“草地”、“水域”、“交通运输用地”。
- 依据土地利用方式和经营特点,考虑到城市管理等有关部门的需求,设定“商服用地”、“工矿仓储用地”、“住宅用地”、“公共管理与公共服务用地”。
- 为了保证地类的完整性,对上述一级类中未包含的地类,设定“其他土地”。
二级类设定
- 二级类是依据自然属性、覆盖特征、用途和经营目的等方面的土地利用差异,对一级类进行具体细化。
6)、地类认定的基本原则
- 按照《土地利用现状分类》的地类含义来确定用地类型
- 地类认定应保持唯一性
- 地物在空间上垂直交叠时,按最上层的地物确定用地类型
- 地物在空间上水平交叉时,按主要的地物确定用地类型
2、高空间分辨率多特征影像植被分类算法
1)、研究方法
2)、研究区
3)、数据源
- 卫星数据
- 实测数据
4)、特征选择
- 特征参数:植被相关指数特征、纹理特征。
- 特征选择方法
- 特征分析
5)、面向对象分类
6)、结论
3、基于多时相植被分类算法
1)、研究方法
2)、研究区
3)、数据源
4)、NDVI时间序列构建
- NDVI计算
- NDVI时间序列平滑处理
- 作物NDVI曲线分析
5)、影像分割
6)、结果与分析
- 分类结果
- 精度评价