MHF-Net(CVPR2019,TPAMI2020):一种可解释的光谱融合网络

Miracle Fan

已于 2023-12-18 15:40:50 修改

阅读量1.7k

点赞数 17

分类专栏：光谱图像文章标签：超分辨率重建计算机视觉人工智能深度学习 tensorflow 神经网络

于 2023-12-18 11:27:56 首次发布

本文链接：https://blog.csdn.net/qq_49729636/article/details/135058715

版权

光谱图像专栏收录该内容

7 篇文章

订阅专栏

本文提出MHF-Net，一种深度学习模型，通过神经网络优化融合模型，赋予每个模块物理意义，解决多光谱和高光谱图像融合中的可解释性和响应不匹配问题。该方法考虑了内在生成机制，增强了网络对先验知识的理解和应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

MHF-Net

Paper：MHF-Net: An Interpretable Deep Network for Multispectral and Hyperspectral Image Fusion

Code：MHF-net: tpami，cvpr

简介

在光谱融合超分的领域中，现有传统方法极大依赖于手工先验知识，造成大量的主观性问题，而基于深度学习的方法，只是利用了通用图像超分的框架进行的处理，不具有很好的可解释性。

基于此，本论文从融合模型下手，通过将模型使用神经网络进行优化求解，让提出的MHF-net的每个模块都具有其自己的物理意义。在网络架构基础上，还针对训练数据和测试数据响应矩阵不匹配的问题进行了单独设计。

现阶段问题

2023-12-12_21-10-46

即使已知R,C从退化的数据立方体转为三维数据立方体是ill-posed问题（不存在唯一解的问题）
- 在传统的无监督方法中，有必要将X背后的先验结构数学编码为正则化器
- 具体来说，在传统的无监督 MS/HS 融合方法中，通常需要在 X 上预先假设先验作为解决问题的正则化器,例如，早期的MS/HS融合技术继承了泛锐化原理，用小波级数展开[14]、[61]表示HS图像。然后，假设 HS 图像的空间信息可以在学习的字典 [2]、[15]、[63] 下稀疏表示，进一步利用 HS 图像上的空间稀疏表示来完成任务。此外，[31] 在 HrHS 图像上采用局部空间平滑度，并在他们的模型中使用总变化 (TV) 正则化。最近的一些方法不是从 HrHS 探索空间先验知识，而是假设 HrHS 上具有更多的内在光谱相关性，并采用低秩矩阵分解技术沿光谱 [54] [62] [30] 对此类先验进行编码。
- 合理性依赖于手动强加于未知 HrHS 的先验假设来恢复,这些具有主观和相对简单的形式的手工先验总是不能充分和自适应地反映真实HSIs背后的内在复杂空间和光谱配置
缺乏可解释性、偏离先验配置：
- 现有的DL方法基本是通用超分架构，忽略了生成HrHS的内在理解，缺乏可解释性。
- 忽略了一般HS图像明显拥有的先验知识结构，如光谱低秩性。这可能会导致网络输出偏离一般先验配置，从而影响恢复精度，

主要贡献

充分考虑MS/HS融合的内在生成机制的DL方法，使用Y的完整基集进行计算，网络所有模块都具有可解释性
考虑了训练和测试阶段响应不同的问题，将响应也作为网络输入进行模型的训练

2023-12-12_21-10-11

模型优化

$Z=C(YA+\hat{Y}B)+N$

设计优化问题：
$\min_{\hat{\boldsymbol{Y}}}\left\|C\left(YA+\hat{Y}B\right)-Z\right\|_F^2+\lambda f\left(\hat{\boldsymbol{Y}}\right),$
采用proximal gradient algorithm进行参数更新

其中 $Q(\hat{Y},\hat{Y}^{(k)})$ 是二阶近似： $f(x)\approx f(x_0)+f^{\prime}(x_0)(x-x_0)+f^{\prime\prime}(x_0)\frac{(x-x_0)^2}2$
$\begin{aligned} Q\left(\hat{\boldsymbol{Y}},\hat{\boldsymbol{Y}}^{(k)}\right)& =g\left(\hat{\boldsymbol{Y}}^{(k)}\right)+\left<\hat{\boldsymbol{Y}}-\hat{\boldsymbol{Y}}^{(k)},\nabla g\left(\hat{\boldsymbol{Y}}^{(k)}\right)\right> \\ &+\frac1{2\eta}\left\|\hat{Y}-\hat{Y}^{(k)}\right\|_{F}^{2}+\lambda f\left(\hat{Y}\right), \\ \end{aligned}$
其中 $g(\hat{Y}^{(k)})=\|C(YA+\hat{Y}^{(k)}B)-Z\|_{F}^{2}$ 同时 $\eta$ 作为步长的角色

A Fast Iterative Shrinkage-Thresholding Algorithm for Linear Inverse Problems

2023-12-18_10-53-00

根据上图，将优化问题转化为：
$\min_{\hat{\boldsymbol{Y}}}\frac{1}{2}\left\|\hat{\boldsymbol{Y}}-\left(\hat{\boldsymbol{Y}}^{(k)}-\eta\nabla g\left(\hat{\boldsymbol{Y}}^{(k)}\right)\right)\right\|_{F}^{2}+\lambda\eta f\left(\hat{\boldsymbol{Y}}\right).$
同时，其通解写为：
$\hat{Y}^{k+1}=prox_{\lambda\eta}(\hat{\boldsymbol{Y}}^{(k)}-\eta\nabla g(\hat{\boldsymbol{Y}}^{(k)}))$
又因为 $\nabla g(\hat{Y}^{(k)})=C^{T}\left[C\left(Y A+Y^{(k)}B-Z\right] B^{T}\right.$

就可以将prox函数式子转为：
$\hat{Y}^{k+1}=prox_{\lambda\eta}\left(\hat{\boldsymbol{Y}}^{(k)}-\eta C^{T}\left(C\left(Y A+Y^{(k)}B\right)-Z\right) B^{T}\right)$

求解 $\nabla g(\hat{Y}^{(k)})$

A Fast Iterative Shrinkage-Thresholding Algorithm for Linear Inverse Problems

矩阵求导、几种重要的矩阵及常用的矩阵求导公式-CSDN博客

矩阵的 Frobenius 范数及其求偏导法则_f范数求导-CSDN博客

$KaTeX parse error: Undefined control sequence: \tr at position 85: …=\operatorname{\̲t̲r̲} \left( \left …$
在这里插入图片描述

网络设计

由 $X$ 是高分辨率图像，将其变为 $E$ 为低分辨率图像，可以将 $C$ 理解为一个下采样操作，反之 $C^T$ 则为上采样操作，对于 $prox_{\lambda\eta}$ 可以将其看为一个复杂的仿射变换，比作一个神经网络操作。
$\begin{gathered} X^{(k)}=YA+\hat{Y}^{(k)}B, \\ E^{(k)}=CX^{(k)}-Z, \\ G^{(k)}=\eta C^{T}E^{(k)}B^{T}, \\ \hat{\boldsymbol{Y}}^{(k+1)}=\mathrm{prox}_{\lambda\eta}\left(\hat{\boldsymbol{Y}}^{(k)}-\boldsymbol{G}^{(k)}\right). \end{gathered}$
2023-12-18_11-01-00