高光谱解混方法概述
本文为论文笔记,目的是自己看过的论文别忘了。。。
问题引入
问题何来?
由于高光谱成像仪(又称Hyperspectral Cameras HSCs)的快速发展,它可以在一瞬间收集到成百上千的光谱通道,这远远多于过去的多光谱摄像机。由此,针对于通过高光谱分析来对材料进行识别的工作快速开展。然而,由于
- 相对于所探查的平面与任务,十分低的空间分辨率
- 由于世界上的物质几乎均为混合物,还存在着泥土一样的混合物,导致微观材料混合
- 广泛的发生着多重散射,例如云朵之间,玻璃之间等。
导致所观察到的像素均为混合状态,这极大地影响到了材料的分析,因此高光谱解混任务势在必行。
基础知识
在高光谱任务中,混合像元(像素)被假设为几种(纯净)物质的混合体。而这几种(纯净)物质被称为端元(endmember)。
核心任务
高光谱解混任务的核心为以下三点:
- 计算出该像素中包含的端元的数量(或者种类)
- 分解出这几种端元的特征光谱
- 得出这些端元的丰度(abundances)
基础方法
众所周知,HSC收集到的光是是视野内的物质互相散射而混合在一起的光。表面与底层的物质组成一个数据立方,每个图都对应着这个立方所发出的(在各个波长的)辐射。
如下图:
线性与非线性模型
光谱结构的根本任务就是将一个高光谱图像分解为一系列(被称为端元的)组成光谱或特征光谱。和一系列与前者相对应的丰度值。
-
然而,这个定义十分暧昧,首先,纯物质的概念十分主观。例如,假设一幅高光谱图像包含地面上的砖块、砖块之间的灰浆以及通过砖块裂缝生长的两种植物测量的光谱。那么,你或许可以选出四种端元。但,如果这些东西仅仅存在于极少的像元之中,你又可以仅用一个端元(砖块)代替。又或者,我们仅仅需要指导哪里是砖块,哪里是植物,而不需区分两种物体,那么我们或许又只需要分为三个端元。
因此我们可以得出一个结论:端元的选择是随实际应用而定的 -
其次,关于比例(或者说权重)的概念也十分微妙。在线性混合模型中,某个像素点中的丰度值与相应端元所占面积的比例有关。但是在非线性混合中却没这么简单。比如:模型在解混时,往往将高光谱图像映射到与反射率有关的数据中。然而,反射率通常不是材料质量的线性函数,也不是材料横截面积的线性函数。一个很小但反射率很大的物体很可能会掩盖掉更大但更不善于反光的图像。
不过,尽管有这些概念依旧存在疏漏,但是大量实验表明,目前的实验依旧是有进展的。
线性混合模型
混合尺度为宏观可见尺度,或者入射光只与一种物质相互作用,线性混合模型成立。
来自材料的光几乎完全分离,但是依旧会在测量仪器之中重新混合在一起。如下图:
这样的光可以直接由权重积求出。权重一般直接来自于其长度,面积的比例。
非线性混合模型
非线性混合是由于光在场景中的多种材质物质之间相互散射。这些相互作用可以是经典的,多层的,微观的,紧密的或者水平的。
- 当光从一个或多个物体散射,被其他物体反射,并最终由高光谱成象仪测量时,就会发生经典混合。
y
i
=
∑
j
=
1
p
ρ
i
j
α
j
+
ω
i
y_i=\sum_{j=1}^{p}{\rho_{ij}\alpha_j+\omega_i}
yi=∑j=1pρijαj+ωi
非负性:
α
j
≥
0
,
j
=
1
,
.
.
.
,
p
\alpha_j\geq0,\ j=1,\ .\ .\ .,p
αj≥0, j=1, . . .,p
合为一:
∑
j
=
1
p
α
j
=
1
\sum_{j=1}^{p}{\alpha_j=1}
∑j=1pαj=1
已经有人证明了,该类模型其实是一个反射系数乘积的无穷次幂序列(不是很理解,会再查看论文的)。然而一般来说,一阶项就足够表示了,这使得双线性模型成为可选项中的优选。
- 当两种材料均匀混合时,就会发生微观混合。在这种情况下,相互作用由一种物质的分子发出的光子被另一种物质的分子吸收,而另一种物质的分子可能会发出更多的光子。
这种混合被认为发生在反照率层而不是反射率层。混合物的表观反照率是各物质反照率的线性平均值,而反射率是反照率的非线性函数,从而形成了一种不同类型的非线性模型。
下图是对于上述情况的描述:
如今,大多数模型都是基于线性混合模型构造的。这是因为,虽然它十分的朴素与平凡,但是它总是能得出一个能让人接受的大致结果。并且与非线性混合模型相比,线性混合已经在解混模型构筑方面延续了至少25年了,拥有深刻的知识与经验积累。
非线性方法的概述
- 辐射传递模型(RTT)是一个建立良好的数学模型,用于描述光子与场景中物质相互作用时能量的传递。使用RTT可以帮助完全基于物理的非线性解混方法推断光谱特征与材料密度(只可惜,由于场景的各类参数十分难以甚至不可能获得,这是一个几乎不可能完成的病态假设任务)。
- 核方法,一种希望避免完全使用物理而是由物理激发的模型。例如:模型内部被kernel分为多个核,其中一部分是足够灵活,用于表现非线性degree,而另外一部分是受物理启发而研制的。
- 双线性模型被提出去解决散射效应。它被安装在标准模型中,起到为混合系数增加约束的作用。
- 机器学习方法,例如基于神经网络,在监督或半监督条件下,自行学习出各类参数的方法。
- 完全无监督的解混模型(由于有监督的数据实在标的不好,完全无监督才如此受人瞩目)
高光谱解混流程
流程图如下:
大气校正(Atmospheric Correction)
由于大气层的存在,许多光被衰减和散射开,这严重影响了传感器处的辐射。大气校正技术通过将亮度转换为反射率来补偿这种影响。
数据减少(Data Reduction)
图像光谱的空间跨度往往是远小于可用的频带数量。识别适当的子空间(映射过来)有助于降维,提升算法性能,复杂性与数据存储能力。但需要注意的是,如果线性模型是准确的,则生成的信号子空间维度一定是小于等于端元的数量(因为,最多一个频带保存一个端元的特征)。
解混(Unmixing)
分解步骤包括识别场景中的端元和每个像素处的丰度分数。这里将讨论三种一般的方法。
- 几何方法利用的事实,线性混合向量是在一个单纯形集或在一个正锥。
- 统计方法侧重于使用参数估计技术来确定端元和丰度参数。
- 稀疏回归方法,将解混表述为一个线性稀疏回归问题,其方式类似于压缩感知。这一框架依赖于通常在实验室中获得的光谱库的存在。
- 稀疏编码,它从数据中学习字典,从而避免了对库的需要,也避免了与获取库和数据的不同条件有关的校准问题。
反演(Inversion)
在已知观测谱向量和识别的端元的情况下,反演步骤包括求解一个约束优化问题,使观测谱向量与推断谱特征所跨越的线性空间之间的残差最小化;隐式的部分丰度常常被约束为非负且总和为1(即,它们单纯属于概率部分)。然而,在许多高光谱分解方法中,端元确定和反演步骤是同时执行的。