半监督分类算法_基于同质区和迁移学习的高光谱图像半监督分类

针对高光谱图像分类的标记样本获取难题,提出一种基于同质区和迁移学习的半监督分类方法。通过分割获取高纯度同质区,扩展训练样本,然后利用迁移学习减少图像中地物分布差异,实现更准确的分类。实验显示该方法能有效提升分类效果。
摘要由CSDN通过智能技术生成

作 者 信 息

赵婵娟,周绍光,丁 倩,刘丽丽

(河海大学 地球科学与工程学院,江苏 南京 211100)

【摘要】针对高光谱遥感图像分类中标记样本难获取的问题,提出了一种基于同质区和迁移学习的新型半监督分类方法。首先对高光谱图像进行分割得到高纯度的同质分割斑块,获取大量扩展训练样本。并在此基础上引入迁移学习,将扩展训练样本作为源域,剩余未标记样本作为目标域,实现多次迁移,从而减少同一幅图像上各地物的分布差异,并保留其各自的内部属性。实验结果表明,该方法是一种有效的高光谱图像半监督分类方法。

【关键词】高光谱图像分类;图像分割;半监督;迁移学习

【中图分类号】TP79 【文献标识码】A 【文章编号】1672-1586(2019)05-0045-08

引文格式:赵婵娟,周绍光,丁 倩,等. 基于同质区和迁移学习的高光谱图像半监督分类[J].地理信息世界,2019,26(5):45-52.

正文

0 引 言

近年来,遥感技术和机器学习的进步使高光谱数据得到了广泛应用。其中,高光谱图像分类是遥感领域研究的重要问题之一。在实际应用中,由于大量样本的标记难以获取,未标记的样本有很多且更易获得。因此,如何利用大量未标记样本信息进行分类器的学习,提高其泛化能力,成为当前的研究热点。半监督分类由于能够充分利用少量标记样本和大量无标记样本,并获得更高的分类精度,引起了研究者的高度关注。半监督分类在实践中具有很大的应用价值,一般来说,在半监督学习中,5种模型被广泛使用。主要包括生成式模型、自训练、协同训练、直推式支持向量机和基于图的方法。

上述这些半监督分类方法,通常假设数据的生成机制不随环境改变,即训练样本和测试样本概率分布一致或者位于同一特征空间。若数据分布有差异会造成这些方法的分类效果变差。而我们获得的许多有标记样本的遥感图像可能不满足这个条件,直接用于构建待分类遥感图像的分类器效果不是很理想,若重新标记新的数据来训练模型以适应新的数据分布,代价太高且费时费力。针对这一问题,本文提出了一种基于同质区和迁移学习的半监督高光谱图像分类方法。首先对高光谱图像进行分割获取纯度较高的同质区斑块,然后将有标记样本点所在斑块作为源域,剩余未标记样本作为目标域,实现多次迁移,减少同一图像中各地物的分布差异,最终完成对目标域中大量未标记样本的分类。实验结果表明,可以得到较好的分类效果。

1 同质区获取

本文是以图像分割生成的同质区斑块为基础,基于同质区特性,可以在少量标记样本的基础上获取大量可靠的扩展训练样本,实现对分类器的有效训练。首先,本文通过波段选择的方法选出高光谱图像中3个差异性最大的波段,利用这3个波段对高光谱图像进行Meanshift初始分割,该算法是一种特征空间分析方法,其显著优点是计算量小且简单易实现,是一种有效的统计迭代算法。得到图像的初始分割斑块后,分析斑块的分割纯度不够高,故对这些斑块进行进一步的提纯,算法流程如下(其中center代表中心点,value代表偏移矩阵,S代表中心点的偏移之和):

1)以光谱特征为计算标准,计算所有像素点的特征均值,作为中心点center1;

2)依次计算各像素点和中心点的特征差,并由低到高进行排序得到偏移矩阵;

3)选取偏移矩阵的前40%的像素点,计算其特征均值作为新的中心点center2;

4)计算center2与center1的特征差值的和S;

5)若S大于c2ccf745bf4bece7a5da63a81c118167.png,则重复步骤2)~4),直至S达到收敛;

6)最后选取与特征中心点差值不超过最大差值的60%的点作为斑块的同质点。

高光谱图像经过初始分割和提纯后,剩余残留的影像部分大多是比较杂乱的地物区和类别边界处,故对于剩余被剔除的遗留影像,采用超像素分割(Simpl Linear Iterative Clustering,SLIC),将分割数目增多,使得生成的超像素尺寸足够小,从而确保同质区斑块的分割纯度。最终,将像素小于2的斑块与邻近相似度最高的斑块进行合并,得到最终的同质区斑块。

2 结合同质区和迁移学习的半监督分类

2.1 迁移成分分析

本文选取的迁移学习方法是迁移成分分析(Transfer Component Analysis,TCA),其主要解决迁移学习中概率分布问题,是领域自适应(Domain Adaptation,DA)的基本方法之一,该方法基于这一假设:源域和目标域边缘分布不同,即P (XS )≠P (XT ),直接用传统的机器学习方法会导致最终的分类效果较差。故假设存在一个特征映射,使得映射后数据的边缘分布P (Φ(XS))≈P (Φ(XT)),更进一步,条件分布P (YSΦ(XS))≈P (YTΦ(XT

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值