特征图大小_基于张量嵌入框架特征提取的PolSAR 地物分类

本文基于近期收录于IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING的论文 “PolSAR Feature Extraction Via Tensor Embedding Framework for Land Cover Classification”,作者:任博,侯彪, Jocelyn Chanussot,焦李成。

一、动机与背景

极化合成孔径雷达(PolSAR)是一种多通道雷达系统,相对传统的单极化合成孔径雷达(SAR),HH、HV、VH 、VV通道能够记录更完整的后向散射信息。更全面的描述目标的几何结构和物理特性。随着成像雷达系统的发展,越来越多的先进机载和星载合成孔径雷达系统相继投入使用,如ALOS2、RADARSAT-2 和TerraSAR。一方面,极化SAR数据能为遥感数据理解与解译提供丰富的目标信息;另一方面,丰富的遥感数据与传感器发展也促进了PolSAR 遥感技术进步和应用领域的拓展,包括自然资源勘探、环境监测、农业控制、森林植被变化检测 以及目标的检测与识别等军事和民用领域。地物分类作为PolSAR 数据处理领域的重要研究方向之一,引起了众多研究者的兴趣。在利用机器学习进行遥感数据处理时,特征提取/融合/选择和分类器设计是两个重要的步骤。本文着重探讨极化特性和空间信息,以获得一组可分性强的特征进行地物分类。提高分类性能的一个关键问题是选择和提取最有判别性的PolSAR 特征。除了极化散射和目标分解得到的原始特征外,一些方法还结合了基于图像处理技术,从PolSAR 伪彩色图像中获取颜色、纹理和结构信息作为特征。例如利用灰度共生矩阵、Gabor 等方法提取技术从SAR 图像中提取空间特征。它们为分类器学习和模型构建提供了足够的支持。如何充分利用这些多模特征是PolSAR 数据解释中的一个重要问题。在PolSAR 地物分类技术中,到底是采用单模态特征还是多模态特征有优势,目前还没有定论,本文通过融合PolSAR数据的多模态描述提取出高判别性的特征,从而提高分类器的地物分类能力。张量作为高阶的向量、矩阵,可以很好的保持数据的本征特性,并且能提供较准确的数据表示,尤其是以像素点为分类单元的地物分类任务中,常利用图像块对单个像素点进行描述。受多线性表示(Multilinear Representation,MR)与图嵌入框架(Graph Embedding Frameworks,GEF)的影响,我们将基于张量的线性投影方法例如:张量线性判别分析(Tensor Linear Discriminant Analysis, TLDA),张量局部保持投影(Tensor locality preserving projection, TLPP),张量判别嵌入(Local Discriminant Embedding, TLDE), 张量邻域保持嵌入(Tensor Neighbor Preserving Embedding, TNPE),和张量主成分分析(Tensor Principal Component Analysis, TPCA)统一到同一框架中进行PolSAR数据的特征提取。此框架可以通过本征矩阵和惩罚矩阵进行描述,其中本征矩阵可以通过特征的相似性与特征图结构进行计算,惩罚矩阵可在通过不同的约束进行计算,算法总体框架如下图所示。

7065b9b4ed623303f85abef359c58175.png

二、方法思想

PolSAR 数据在实际地物分类任务中,可以用张量很好地表示。考虑到每一个像素点可以利用三阶张量(立方体)进行表征,通过这种高阶数据表征形式可以更好的获取数据的空间信息,防止了向量展开后对数据结构信息的破坏。本文为了对 PolSAR 数据进行全面的分析,从不同的模态中提取多样性特征,如对极化SAR伪彩图处理获取图像特性、极化目标分解参数、原始极化散射特性等作为极化SAR数据不同模态的特征。给定一组张量 其中, 是 m 模的维数,M 是张量的阶。张量嵌入框架寻找 M 个投影矩阵 , 来改变每种模式下的维数。然后,得到紧致的张量 对原始数据进行描述。紧致张量可由以下公式投影得到: 投影矩阵将原始数据映射到低维空间,保持数据的本征拓扑结构。我们可以 将线性嵌入方法扩展到一个高阶张量嵌入框架中,则扩展的张量嵌入模型可以用如下的目标函数表示:

为进行目标函数的优化,需要将高阶张量转化为矩阵形式 ,也是就是将张量在模展开成矩阵并通过多个投影矩阵交替迭代投影到低维的矩阵空间。方便起见可以将目标函数转为矩阵迹的形式:

在得到这个重新表述的函数之后,我们可以利用一对矩阵 和 将目标函数统一到一个框架中。第一个矩阵 可以由样本的图结构和张量距离来计算,它也被称为本征矩阵。第二个矩阵 是在统计、几何性质或有监督信息的约束下构造的,被定义为惩罚矩阵。在上式中,我们有 和。当 ,以上,为TLPP的本征矩阵和惩罚矩阵。这两个矩阵不限于固定的无监督构造方法,而且可以在有监督方法、数据分布特性或其他先验信息约束下构造。

在定义了两个矩阵 和 后,目标函数得到一个统一的模型:

该函数没有闭式解,需要初始化每个投影矩阵 并迭代优化以获得最优解。利用这种张量框架,我们可以提取出内在的 PolSAR 特征。以下表格给出了不同张量表征算法的和。

9647c02d4c23a30fca0892d8e0e07724.png

三、实验分析

文章利用三组PolSAR 数据来证明所提方法的有效性,利用支持向量机(SVM)和k-近邻(KNN)分类器对提取0进行最终的PolSAR 地物分类任务。
  • 第一组数据集为RADARSAT2传感器2010年1月所生产的,覆盖了中国陕西省咸阳和西安的西部地区。该传感器工作在C 波段,数据是以40-50°入射角产生的。这幅图像是从一幅大图上裁剪下来的。该数据大小为512×512 像素,包括三类地物:建筑物、草地和水。空间分辨率为10×5m。
  • 第二组数据集是著名的Flevoland数据集,涵盖荷兰弗莱沃兰地区,于2008年4月生产。原图尺寸为1600×2400 像素,分辨率为10×5m。该图像提供了PolSAR遥感图像地物分类的一幅公开标准图。我们从原图中裁剪一个796×769 大小的典型区域进行分类,包括林地、城市、农田和水域部分。
  • 第三组数据集也是C波段的RADARSAT2传感器数据,覆盖了旧金山金门大桥周边地区,是PolSAR 地物分类最常用的区域之一。原始图像包含1419×1895 像素。我们切割814×781图像进行分类。该区域包括高密度城市、水、植被和低密度城市四类地物。
为了验证所提出的张量嵌入框架在PolSAR 地物分类中的有效性,选择了几种降维算法进行比较。线性算法包括无监督ICA、PCA、线性化的流形学习方法(LPP 和NPE)以及有监督的LDA。提取特征的窗口大小设置为9×9。图嵌入算法中的邻域数设置为15。直接使用FastICA 包来测试ICA 算法。所使用的PCA、LPP 和NPE 算法的代码来自Laurens van der Maaten 的维度约减工具箱。利用两种典型的张量嵌入框架的算法(GTDA 和TPCA)研究了训练样本个数和特征块大小对分类性能的影响。由于这三个数据集都是由RADARSAT2产生的,并且具有相同的分辨率,因此特征块大小在3×3、5×5、7×7、9×9、13×13 范围进行变化和分析。下图给出了总体分类性能随训练样本数和特征块大小变化的关系。从训练次数的方向看,OA 随着训练次数的增加而增加。随着训练次数超过10次,OA 增长保持稳定和较高值。因此,部分实验在每一类的样本数大于或等于20次的情况下进行。随着特征块大小的增加,OA 的缓慢增长并在9×9 尺寸达到稳定和小幅增长。特征块越大,获取的地理和空间信息就越多,可以获得较高的分类能力,但是对计算带来较高的负载,因此以下实验较多选取9×9大小特征块进行。

b8f5165734b7c325c78de44f4f4cfaf2.png

在对特征进行分类时,从总样本中随机抽取训练样本,对所有方法进行10 次反复测试,得到平均值进行比较。在三个不同数据集中报告了分类结果。比较了总体准确度(OA)、平均准确度(AA)、每一类的准确度和Kappa系数四个评价指标。从下图的这些分类结果可以看出,该方法可以获得更好的分类结果在AA、OA、Kappa 系数和分类图方面的性能优于其他最方法。在下表中,所有的张量嵌入方法都获得了最佳的OA 和AA 结果。

1a089fe5fd27e1b6eeaabe5d06ab4da1.png

a17017fd4903b0a4845520d2df0f3dc8.png

在RADARSAT2 Flevoland 数据集中,张量嵌入方法也获得了更好的可视化性能,这比传统的线性嵌入技术要好。建筑物区域(红色)很难区分,从分类图上我们可以看到,它和一些林地混合在一起,但是所提出的张量方法具有较好的空间一致性,得到了较好的城市区域分类结果。

35f7c6accd38d5111e5f890fa9736a8f.png

ef462068463db8d2d18207b5be15c7bd.png

在RADARSAT2 旧金山数据集中,我们可以看到几乎所有的方法都能在水域和植被区域表现出良好的分类性能。绝大多数OA 都在90%以上,有些算法甚至超过了99%。同时,需要注意的是,线性嵌入技术、原始数据和Wishart 分类器在低密度城区和高密度城区造成分类效果不佳,部分OA 低于80%。这是因为这些城市地区具有高度的相似性,很难从原始特征中直接对它们进行分类。但观察分类图,可以得出结论,张量嵌入方法可以获得最佳的可视化性能,特别是在城市地区。

5d72fca624fe0f734b04ac44a5adefcd.png

aeeef238a5946b66257f86d7abbf34ce.png

四、结论和展望

本文提出一个张量嵌入框架,将不同的线性降维技术转化为张量形式并应用于PolSAR地物分类任务中。在该框架下,张量表示大大提高了PolSAR 数据的特征提取能力,为PolSAR 地物分类提供了高判别性特征。根据训练样本的几何、统计性质和先验约束,构造惩罚矩阵和本征矩阵,计算所得到的投影矩阵可以有效地解决out-of-sample问题。张量方法结合了像素点周围的空间信息,有效的保持了数据的空间结构信息,具有较好的分类准确率。今后,我们将着重研究PolSAR 数据处理中多模特征的张量性质,利用多模空间的相干性,并考虑如何利用更合适的张量距离来构造相似矩阵或特征图。感谢GIPSA 实验室(法国格勒诺布尔图像语音信号自动化实验室)给予的帮助和欧洲航天局提供的PolSARpro软件来提取相应的极化特征。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值