本文基于近期收录于IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING的论文 “PolSAR Feature Extraction Via Tensor Embedding Framework for Land Cover Classification”,作者:任博,侯彪, Jocelyn Chanussot,焦李成。
一、动机与背景
极化合成孔径雷达(PolSAR)是一种多通道雷达系统,相对传统的单极化合成孔径雷达(SAR),HH、HV、VH 、VV通道能够记录更完整的后向散射信息。更全面的描述目标的几何结构和物理特性。随着成像雷达系统的发展,越来越多的先进机载和星载合成孔径雷达系统相继投入使用,如ALOS2、RADARSAT-2 和TerraSAR。一方面,极化SAR数据能为遥感数据理解与解译提供丰富的目标信息;另一方面,丰富的遥感数据与传感器发展也促进了PolSAR 遥感技术进步和应用领域的拓展,包括自然资源勘探、环境监测、农业控制、森林植被变化检测 以及目标的检测与识别等军事和民用领域。地物分类作为PolSAR 数据处理领域的重要研究方向之一,引起了众多研究者的兴趣。在利用机器学习进行遥感数据处理时,特征提取/融合/选择和分类器设计是两个重要的步骤。本文着重探讨极化特性和空间信息,以获得一组可分性强的特征进行地物分类。提高分类性能的一个关键问题是选择和提取最有判别性的PolSAR 特征。除了极化散射和目标分解得到的原始特征外,一些方法还结合了基于图像处理技术,从PolSAR 伪彩色图像中获取颜色、纹理和结构信息作为特征。例如利用灰度共生矩阵、Gabor 等方法提取技术从SAR 图像中提取空间特征。它们为分类器学习和模型构建提供了足够的支持。如何充分利用这些多模特征是PolSAR 数据解释中的一个重要问题。在PolSAR 地物分类技术中,到底是采用单模态特征还是多模态特征有优势,目前还没有定论,本文通过融合PolSAR数据的多模态描述提取出高判别性的特征,从而提高分类器的地物分类能力。张量作为高阶的向量、矩阵,可以很好的保持数据的本征特性,并且能提供较准确的数据表示,尤其是以像素点为分类单元的地物分类任务中,常利用图像块对单个像素点进行描述。受多线性表示(Multilinear Representation,MR)与图嵌入框架(Graph Embedding Frameworks,GEF)的影响,我们将基于张量的线性投影方法例如:张量线性判别分析(Tensor Linear Discriminant Analysis, TLDA),张量局部保持投影(Tensor locality preserving projection, TLPP),张量判别嵌入(Local Discriminant Embedding, TLDE), 张量邻域保持嵌入(Tensor Neighbor Preserving Embedding, TNPE),和张量主成分分析(Tensor Principal Component Analysis, TPCA)统一到同一框架中进行PolSAR数据的特征提取。此框架可以通过本征矩阵和惩罚矩阵进行描述,其中本征矩阵可以通过特征的相似性与特征图结构进行计算,惩罚矩阵可在通过不同的约束进行计算,算法总体框架如下图所示。二、方法思想
PolSAR 数据在实际地物分类任务中,可以用张量很好地表示。考虑到每一个像素点可以利用三阶张量(立方体)进行表征,通过这种高阶数据表征形式可以更好的获取数据的空间信息,防止了向量展开后对数据结构信息的破坏。本文为了对 PolSAR 数据进行全面的分析,从不同的模态中提取多样性特征,如对极化SAR伪彩图处理获取图像特性、极化目标分解参数、原始极化散射特性等作为极化SAR数据不同模态的特征。给定一组张量 其中, 是 m 模的维数,M 是张量的阶。张量嵌入框架寻找 M 个投影矩阵 , 来改变每种模式下的维数。然后,得到紧致的张量 对原始数据进行描述。紧致张量可由以下公式投影得到: 投影矩阵将原始数据映射到低维空间,保持数据的本征拓扑结构。我们可以 将线性嵌入方法扩展到一个高阶张量嵌入框架中,则扩展的张量嵌入模型可以用如下的目标函数表示:为进行目标函数的优化,需要将高阶张量转化为矩阵形式 ,也是就是将张量在模展开成矩阵并通过多个投影矩阵交替迭代投影到低维的矩阵空间。方便起见可以将目标函数转为矩阵迹的形式:
在得到这个重新表述的函数之后,我们可以利用一对矩阵 和 将目标函数统一到一个框架中。第一个矩阵 可以由样本的图结构和张量距离来计算,它也被称为本征矩阵。第二个矩阵 是在统计、几何性质或有监督信息的约束下构造的,被定义为惩罚矩阵。在上式中,我们有 和。当 ,以上,为TLPP的本征矩阵和惩罚矩阵。这两个矩阵不限于固定的无监督构造方法,而且可以在有监督方法、数据分布特性或其他先验信息约束下构造。
在定义了两个矩阵 和 后,目标函数得到一个统一的模型:该函数没有闭式解,需要初始化每个投影矩阵 并迭代优化以获得最优解。利用这种张量框架,我们可以提取出内在的 PolSAR 特征。以下表格给出了不同张量表征算法的和。
三、实验分析
文章利用三组PolSAR 数据来证明所提方法的有效性,利用支持向量机(SVM)和k-近邻(KNN)分类器对提取0进行最终的PolSAR 地物分类任务。- 第一组数据集为RADARSAT2传感器2010年1月所生产的,覆盖了中国陕西省咸阳和西安的西部地区。该传感器工作在C 波段,数据是以40-50°入射角产生的。这幅图像是从一幅大图上裁剪下来的。该数据大小为512×512 像素,包括三类地物:建筑物、草地和水。空间分辨率为10×5m。
- 第二组数据集是著名的Flevoland数据集,涵盖荷兰弗莱沃兰地区,于2008年4月生产。原图尺寸为1600×2400 像素,分辨率为10×5m。该图像提供了PolSAR遥感图像地物分类的一幅公开标准图。我们从原图中裁剪一个796×769 大小的典型区域进行分类,包括林地、城市、农田和水域部分。
- 第三组数据集也是C波段的RADARSAT2传感器数据,覆盖了旧金山金门大桥周边地区,是PolSAR 地物分类最常用的区域之一。原始图像包含1419×1895 像素。我们切割814×781图像进行分类。该区域包括高密度城市、水、植被和低密度城市四类地物。