高光谱解混：基于几何，统计，稀疏回归的方法概述

最新推荐文章于 2024-08-30 11:01:03 发布

宅家懒人才顺

最新推荐文章于 2024-08-30 11:01:03 发布

阅读量5.3k

点赞数 10

分类专栏：总结文章标签：计算机视觉图论

本文链接：https://blog.csdn.net/CV_Gr_nD/article/details/118702200

版权

7 篇文章 2 订阅

订阅专栏

本文为论文笔记，目的是自己看过的论文别忘了。。。

问题引入

由于高光谱成像仪（又称Hyperspectral Cameras HSCs)的快速发展，它可以在一瞬间收集到成百上千的光谱通道，这远远多于过去的多光谱摄像机。由此，针对于通过高光谱分析来对材料进行识别的工作快速开展。然而，由于

在高光谱任务中，混合像元（像素）被假设为几种（纯净）物质的混合体。而这几种（纯净）物质被称为端元（endmember）。

高光谱解混任务的核心为以下三点：

众所周知，HSC收集到的光是是视野内的物质互相散射而混合在一起的光。表面与底层的物质组成一个数据立方，每个图都对应着这个立方所发出的（在各个波长的）辐射。
如下图：
在这里插入图片描述

光谱结构的根本任务就是将一个高光谱图像分解为一系列（被称为端元的）组成光谱或特征光谱。和一系列与前者相对应的丰度值。

然而，这个定义十分暧昧，首先，纯物质的概念十分主观。例如，假设一幅高光谱图像包含地面上的砖块、砖块之间的灰浆以及通过砖块裂缝生长的两种植物测量的光谱。那么，你或许可以选出四种端元。但，如果这些东西仅仅存在于极少的像元之中，你又可以仅用一个端元（砖块）代替。又或者，我们仅仅需要指导哪里是砖块，哪里是植物，而不需区分两种物体，那么我们或许又只需要分为三个端元。
因此我们可以得出一个结论：端元的选择是随实际应用而定的
其次，关于比例（或者说权重）的概念也十分微妙。在线性混合模型中，某个像素点中的丰度值与相应端元所占面积的比例有关。但是在非线性混合中却没这么简单。比如：模型在解混时，往往将高光谱图像映射到与反射率有关的数据中。然而，反射率通常不是材料质量的线性函数，也不是材料横截面积的线性函数。一个很小但反射率很大的物体很可能会掩盖掉更大但更不善于反光的图像。
不过，尽管有这些概念依旧存在疏漏，但是大量实验表明，目前的实验依旧是有进展的。

混合尺度为宏观可见尺度，或者入射光只与一种物质相互作用，线性混合模型成立。

来自材料的光几乎完全分离，但是依旧会在测量仪器之中重新混合在一起。如下图：
在这里插入图片描述
这样的光可以直接由权重积求出。权重一般直接来自于其长度，面积的比例。

非线性混合是由于光在场景中的多种材质物质之间相互散射。这些相互作用可以是经典的，多层的，微观的，紧密的或者水平的。

$y_i=\sum_{j=1}^{p}{\rho_{ij}\alpha_j+\omega_i}$
非负性： $\alpha_j\geq0,\ j=1,\ .\ .\ .,p$
合为一： $\sum_{j=1}^{p}{\alpha_j=1}$

已经有人证明了，该类模型其实是一个反射系数乘积的无穷次幂序列（不是很理解，会再查看论文的）。然而一般来说，一阶项就足够表示了，这使得双线性模型成为可选项中的优选。

当两种材料均匀混合时，就会发生微观混合。在这种情况下，相互作用由一种物质的分子发出的光子被另一种物质的分子吸收，而另一种物质的分子可能会发出更多的光子。
这种混合被认为发生在反照率层而不是反射率层。混合物的表观反照率是各物质反照率的线性平均值，而反射率是反照率的非线性函数，从而形成了一种不同类型的非线性模型。
下图是对于上述情况的描述：

如今，大多数模型都是基于线性混合模型构造的。这是因为，虽然它十分的朴素与平凡，但是它总是能得出一个能让人接受的大致结果。并且与非线性混合模型相比，线性混合已经在解混模型构筑方面延续了至少25年了，拥有深刻的知识与经验积累。

辐射传递模型（RTT）是一个建立良好的数学模型，用于描述光子与场景中物质相互作用时能量的传递。使用RTT可以帮助完全基于物理的非线性解混方法推断光谱特征与材料密度（只可惜，由于场景的各类参数十分难以甚至不可能获得，这是一个几乎不可能完成的病态假设任务）。
核方法，一种希望避免完全使用物理而是由物理激发的模型。例如：模型内部被kernel分为多个核，其中一部分是足够灵活，用于表现非线性degree，而另外一部分是受物理启发而研制的。
双线性模型被提出去解决散射效应。它被安装在标准模型中，起到为混合系数增加约束的作用。
机器学习方法，例如基于神经网络，在监督或半监督条件下，自行学习出各类参数的方法。
完全无监督的解混模型（由于有监督的数据实在标的不好，完全无监督才如此受人瞩目）