美国高分辨率土地覆盖分类技术进展

  土地覆盖制图中,数据处理技术、信息提取过程是一个系统工程,包括系列基础流程和关键技术。每一个处理过程都会影响到信息提取的准确度和精度。MRLC项目系列数据处理过程包括分类分区方法、数据选取、处理、转换、分类、验证和数据库建设等,见图1。


图1 土地覆盖信息提取技术流程图

  1、土地覆盖分类分区方法

  土地覆盖分类分区是分类的前期准备工作,主要是为了提高土地覆盖分类的精度,有助于分类后各类别多边形或栅格的镶嵌。NLCD1992数据库中,土地覆盖数据以国家行政区为界线分幅保存,数据分幅与土地覆盖类型和地理特征无关,因此产生了图像镶嵌边界存在不同地类相邻的问题。针对大量的经验和教训,2000年土地覆盖调查工作有了很大的改进,在进行分类之前,先对遥感影像进行分区。全美国尺度的土地覆盖成图,理想的方法是通过影像合成,进行分类和边界镶嵌。但由于影像获取日期和气候条件差异,镶嵌结果内部存在很大的光谱梯度变化,影响分类结果的精度。光谱梯度主要反映地物物候、物理、太阳高度、大气和传感器设备等差异,其对地物纹理的区分程度,决定了分类的成功与否。常用的区分光谱梯度的方法是分区的方法,将景观分成多个子区域进行研究,每个子区域具有相同光谱和地物特征。通过分类分区,能够保证区域内光谱差异的最大一致性,可以简化分类模型和提高分类精度。Barer等1994年采用地貌分区的方法,土地覆盖分类研究中所有类别的准确性提高了10%~15%。

  NLCD2000发展的分类分区方法,初始界线基于Omerniar(1987)边界,参照NLCD1992数据层和NOAAAVHRRNDVI数据层。分区边界以300m分辨率NLCD数据层为背景,通过屏幕数字化的方式完成。边界的确定是一个非常主观的过程,涉及大量的基础数据,包括土地类型和全部植被物候特征信息。更细、更准确界线在初次界定的基础上,利用高分辨率TM影像,在像元尺度上进行订正。分区要考虑规模要适宜,地貌特征、土地覆盖类型、光谱特征等要达到最大的一致性。理想上,分类分区单元应覆盖最小数目的高分辨率遥感影像,但考虑到规模上的适宜性和总体上的工作量等问题,大小应以能够有效的反映陆地表面的变化为主。另外,分区单元形状比大小更重要,主要由于植被物候在纬度变化上较大,南北方向地物的差异性变化较大。MRLC2000项目中,全美国共形成了66个分区,阿拉斯加州有23个分区。

  2、遥感影像选取技术

  多时相的遥感影像是NLCD数据库的关键组成部分。美国土地覆盖调查中,遥感影像选取依据土地覆盖景观特征、植被物候和数据质量。土地覆盖类型区分,理想情况应每个分类分区内每轨ETM+应有3景不同时相影像。多景影像识别和确认,可以反映区域植被生长的动态轨迹,有效增加土地覆盖类型的识别精度。植被物候信息主要从多时相的1km分辨率NOAAAVHRR或SPOTVGTNDVI影像中获得。影像选取相关辅助数据存放在NLCD1992数据库中,包括每轨TM所在区域的各种土地覆盖类型的时序NDVI过程,具体有NDVI平均值,植被生长初期值,峰值和衰落时的值和相应的时间,以及各种类别间的NDVI的差值等。MRLC共针对3种情况进行分析:

  (1)植被生长时序NDVI呈现单峰特征地区,一景图像可以选在NDVI最大值处或持续期,具体选择是绿度峰值确定后,峰值持续时间主要依据NDVI值变化小于0.02ö两周,时间范围是最大值期的前或后双周时间。第二景影像选定在植被从静止期开始生长的时间,可参考NDVI值大于0.15处。第三景影像的选取是在其余时段内,能够最大限度的区分所有的土地覆盖类型的时相。影像选取主要考虑峰值前后的遥感影像能够反映植被生长主要的生物量信息,其它的影像能够获取植被生长其它阶段的信息,以及在这些生长阶段的生长变化情况。

  (2)植被生长时序NDVI呈现双峰特征地区,

  第一景和第二景影像的选取如(1),而第三景影像的选取在植被衰落期,或所有的土地覆盖类型NDVI值存在最大不同时段。

  (3)对于不同土地覆盖类型,NDVI峰值时相有很大不同的情况,第一景影像的选取与(1)相同,而第二景影像的选取主要依据第二占主导地位植被的NDVI值达到峰值时相,第三景影像的选取第二种情况中选取方式相同。

  MRLC遥感影像的选取主要以区划单元为主,相邻的单元也存在很多的不同。因此,影像选取需要以植被物候信息,土地覆盖景观特征,以及影像质量信息为基础,建立土地覆盖数据源选取框架。

  3、数据预处理过程

  系统化的遥感数据处理过程非常必要,可以提高土地覆盖信息准确度和精度。MRLC对遥感影像进行几何、大气和辐射纠正。几何校正中重采样选用三次方卷积模型,其较最邻近重采样方法在空间上更加准确合理。为了提高遥感影像数据的地理位置准确性,通过国家高程数据,进行了地形纠正。MRLC2001影像投影采用阿尔伯斯等面积圆锥模型。几何纠正方法的优越性,在多时相、多轨道TM数据叠加时得到充分的体现。辐射纠正采用USGS数据中心的标准数据处理方法,去除1、2、3、4、5、7波段的偏差和异常;6波段近红外数据依据TM影像技术手册,由60m重采样为30m,将热红外影像转化为亮温数据层。

  MRLC采用将影像原始DN值转换为星上反射率的方法,去除影像获取过程中噪音。首先根据遥感影像获取的时相,查表找到日地距离,确定各波段太阳光谱辐射值;然后依据1、2、3、4、5、7波段的转换常数,通过一阶归一化方程,将原始数值转变为星上反射率。这一转换算法有物理依据,容易自动化,不会引入新的数据误差。转换的效果通过假定不变物体方法进行验证,假定不变物体可以选大而平的建筑屋顶、机场跑道,深的水体,稳定的沙石山等。比较DN值和星上反射率影像中假定不变物体光谱值,DN值影像中物体的光谱值随时间变化,非常不稳定;测量二者的噪音,反射率影像噪音比DN值影像噪音小50%。另外原始数值转换为星上反射率,还可以改善影像镶嵌效果。星上反射率值范围在0至1,为了节省硬盘空间,值可以乘以400转化为8位值。如果反射率的值大于016375,则重新置为016375,依据主要是植被反射率值都小于016375,这部分数据不会影响到最终的结果。

  MRLC工作中,遥感影像数据处理量非常大,纠正方法也存在着不确定性,因此大气和地形标准化没有完全实现,目前大部分工作集中在影像去云处理方面。

  4、图像转换变化分析

  全国范围的遥感影像数据的处理和存取,数据流量非常大,需要很大的磁盘空间和处理时间,因此应对遥感影像的多光谱信息进行压缩,保留主要的光谱信息。主成分分析方法是有效的方法和手段,但其处理后的遥感影像解译方面有很大的困难。缨帽变换方法(TC)能够提供标准的亮度、绿度和湿度的图层,这些图层与影像的特征非常相关,有助于在图像间进行对比。Huang等2002年在植被的生长期内,基于10景ETM+影像数据进行了TC变换,保存了98%的遥感影像的光谱信息。TC方法可以在影像大气纠正不能进行情况下,对多景遥感影像间进行标准化处理。

  MRLC发展了基于ETM+影像星上反射率的缨帽变换,依据各个波段的ETM+缨帽变换系数,对ETM+影像的1、2、3、4、5、7波段进行缨帽变换,生成亮度、绿度和湿度图层。同时采用线性变化的方法,将缨帽变换的值按比例重新变换,转换为8位数据范围。具体处理过程中,首先是数据预处理,依据Landsat7标准数据处理流程,将原始DN值转换为星上反射率,其中太阳光照几何影响利用假定不变物体法进行测量;然后进行星上反射率的缨帽变换,每一景ETM+大约有2000个随机样本,对所有随机样本利用主成分分析法定义初始主轴,六个主轴保持正交,依据数百个土壤、不透性表面和高密度植被以及水体样本信息,引导主轴的旋转,完成缨帽变换。MRLC研究中采用的缨帽变换方法,产生的绿度、亮度和湿度图像占有97%的光谱信息。

  5、土地覆盖分类技术

  美国土地覆盖分类方法采用的是Anderson分类体系,其一级分类主要包括水体、耕地、林地等7类,分类准确性可以满足标准偏差85%;二级分类主要包括水体、永久雪和冰、低密度城市、高密度城市、常绿林、耕地、温地等21类。土地覆盖分类可以采用多种方法,包括聚类方法、专家分类方法和神经元网络方法、决策树分类方法等。NLCD1992采用多步非监督聚类方法,分类的前后都利用了辅助数据,分类后结果主要采用手工方法进行修正。NLCD2000采用决策树方法,基于多种辅助数据层叠加分析,依据各层的权重进行分类。辅助数据主要是NLCD1992数据,DEM数据等。

  决策树分类是监督分类方法,可以处理连续或者独立的数据,具有能够解释的分类规则。优越性在于类别的信息是独立的,分类的方法易学,可以推广。主要问题是需要大量的训练样地数据。MRLC决策树采用C5的方法,是基于树状的信息收集和发展模型。它的主要功能包括重复修正功能和交叉验证。重复修正功能主要指建设有序的决策树,每一个后续的决策树都可以修正前一个树的分类错误。每一个决策树都进行精度评估,最后的精确度评价是所有树的精度值的权重平均,这一功能可以提高分类精度5%至10%。交叉验证是用有限数量的参考数据样本,进行训练样本和分类结果精度评估。决策树方法可以通过地面采样数据与决策树输出结果比较,重新确定分类规则,允许用户修改分类中的参数。因此,决策树分类过程对于用户来说是透明的,可以很好的理解辅助数据的权重,评估分类规则,有效的提高分类的精度。

  6、数据产品验证

  土地覆盖分类研究没有精度评估是不完整的。土地覆盖图的精度在基于卫星的制图方法出现之前从未引起关注,通过解译影像编制地图的精度被认为是100%。MRLC土地覆盖分类结果精度评价主要采用N次迭代交叉验证方法。验证过程中,对样点数据要求非常严格,包括样点布设空间分布要合理,样区大小要能反映地物特点,每个类别都要保证样区的规模等,也要考虑样区布设花费的项目承受能力。

  迭代交叉验证将训练数据集分为N个子集,除了选为训练样本外,对剩余样本进行分类;然后将样本的原始值与分类结果进行比较,评价分类结果;训练样本选取采用动态随机方法,试验样本也相应的发生变化,这样不断迭代下去,直到达到了迭代的次数为止;最终所有精度平均值就代表了使用全部参考样本进行分类的精度。交叉验证对区域分类结果的精度评估非常有用,较相关的统计评估方法省时、省力。但要注意的是,精度评估要减少参考数据在空间上的相关性,采样的设计要基于统计,样点的分布要合理。

  7、土地覆盖数据库建设

  MRLC2000改进了土地覆盖数据库设计和建设,为用户提供灵活的应用功能。分类模型超越了传统的方式。传统的分类模型主要依据研究目标,集中在特殊要求特定类别的区分上,造成方法和结果不能推广到其它地区或者是满足其它的项目要求,数据产品也无法应用到其它的部门。MRLC2000改进了数据库,土地覆盖类型可以扩展,能够对超过2000年的土地覆盖类型进行管理。数据库中采用数据图层的管理方式,可以为用户提供单独和合成的信息服务,增加数据应用的潜力。特别是数据库中保存中间数据,改变了以往中间数据产品由于有了最终结果而去除的现象,这些中间图层如光谱聚类、辅助信息和训练数据在相关的遥感应用框架中具有很大的应用潜力。因此数据库拥有大量潜在用户,可以从中得到更多的应用产品,以及通过中间数据继续产生标准化数据产品。

  NLCD2000数据库主要内容:遥感数据包括TM影像每个轨道的三景遥感数据和缨帽变化后的数据;辅助数据图层包括由坡度数据、DEM数据、高程、土壤数据,以及影像生成矢量多边形形状和遥感影像的纹理信息;遥感影像像元内的城市不透性和树冠密度信息;土地覆盖分类结果;分类的规则和元数据,其中分类规则和元数据允许用户进行修改,满足他们对于本地或项目应用的特殊要求;分类结果的精度信息等。本文摘自《美国高分辨率土地覆盖信息提取技术研究进展》更多相关文献尽在地理国情监测云平台。

2010年全球30m分辨率陆表水域数据集(GlobeLand30_WTR2010)是中国捐赠给联合国(2014年9月)的全球30m分辨率土地覆盖数据集(2010)中十个数据集之一。陆表水域是地表覆盖的重要组成部分。该数据集依托全球地表覆盖遥感制图项目,根据全球优选(无云或少云)的2010年及前后1-2年间9907景30m空间分辨率的美国陆地资源卫星(Landsat)TM5、ETM 多光谱影像数据及2640景中国环境减灾卫星(HJ-1)多光谱影像数据。在数据预处理基础上,利用基于像元的水域综合提取、面向对象的图斑处理和人机交互的数据优化等遥感提取方法,兼顾陆表水域遥感提取的高效性和准确性,形成了2010年全球30m分辨率陆表水域数据集(GlobeLand30_WTR2010)。该数据经过部分地区的抽样检验。数据集采用分幅方式组织数据文件,总计759个数据文件组,每个文件组包括3类数据文件,分别为以.Tif, .tfw格式存储的实体数据、以.shp格式存储的数据开发应用的遥感影像数据信息和以.xml格式存储的元数据信息。为便利获取和网络共享,实体数据被分为5个压缩数据文件包(.rar数据格式)。其中,GlobeLand30_WTR2010_1.rar是欧洲和亚洲72?E以西的地表水域数据集文件包;GlobeLand30_WTR2010_2.rar是亚洲72?E以东的地表水域数据集文件包;GlobeLand30_WTR2010_3.rar是北美洲50?以北的地表水域数据集文件包;GlobeLand30_WTR2010_4.rar是北美洲50?以南和南美洲的地表水域数据集文件包;GlobeLand30_WTR2010_5.rar是非洲和大洋洲的地表水域数据集文件包。此外,数据集中包括一个附录数据说明文件(GlobeLand30_WTR2010.xlsx)。数据表明,2010年全球陆表水域总面积为367.54万km2。全球陆表水域的空间分布不均匀。其中,北美洲占据全球地表水域面积40%以上
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值