论文阅读——Deep Variational Network for Blind Pansharpening

最新推荐文章于 2025-10-29 22:06:50 发布

原创

最新推荐文章于 2025-10-29 22:06:50 发布 · 1.2k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#论文阅读 #计算机视觉 #深度学习 #图像处理 #人工智能

Deep Variational Network for Blind Pansharpening

Abstract
PROPOSED METHOD

Abstract

基于深度学习的方法在全色锐化中扮演着重要角色，全色锐化利用全色图像来增强多光谱图像的空间分辨率，同时保持其光谱特征。然而，大多数现有方法在训练过程中主要只考虑一种固定的退化情况。因此，当测试数据的退化情况未知（盲）且与训练数据不同时，这些方法的性能可能会显著下降，这在实际应用中很常见。为了解决这个问题，我们提出了一种用于盲全色锐化的深度变分网络，称为VBPN，它将退化估计和图像融合整合到一个完整的贝叶斯框架中。首先，通过将多光谱图像的噪声和模糊参数以及全色图像的噪声参数作为隐藏变量，我们使用神经网络对融合问题的近似后验分布进行参数化。由于该后验分布中的所有参数都被显式建模，因此可以轻松估计多光谱图像和全色图像的退化参数。此外，我们设计了由退化估计和图像融合子网络组成的VPBN，它可以根据测试数据通过变分推理优化融合结果。因此，盲全色锐化的性能可以得到提升。总的来说，VPBN通过结合基于模型和基于深度学习的优点，具有良好的可解释性和泛化能力。在模拟和真实数据集上的实验证明，VPBN能够实现最先进的融合结果。

PROPOSED METHOD

A. Modeling the Pansharpening Process in a Bayesian Framework

在实际退化场景中， $M$ 和 $F$ 之间的物理关系通常可以构建如下：

$↓_s + N \quad (3)$

其中， $K$ 表示模糊核， $_s$ 表示尺度因子为 $s$ 的下采样操作， $N$ 表示加性高斯噪声。为了更贴近真实场景的建模，本文将 $K$ 定义为各向异性高斯模糊核。

根据公式 (3)，我们可以自然地将 $M$ 的先验分布建模为高斯分布：

$M_i ∼ \mathcal{N} \left( M_i \big| [(F ∗ K) ↓_s]_i, \sigma_i^2 \right), \quad i = 1, \dots, d \quad (4)$

其中， $\sigma_i^2$ 是高斯噪声的噪声方差。为了对 $M$ 进行更精确的细化建模，我们认为 $M$ 中每个像素的模糊和噪声是不同的。 $d$ 表示 $M$ 中的总像素数。

在对观测变量 $M$ 进行建模时，我们引入了三个潜在变量。接下来，需要为变分推断设计融合结果 $F$ 、模糊核 $K$ 和噪声方差 $\sigma_i^2$ 的先验信息。为了计算方便，我们选择了共轭先验分布形式。

对于融合结果 $F$ ，我们引入以下高斯分布作为共轭先验：

$F_i ∼ \mathcal{N} \left( F_i \big| x_i, \varepsilon_0^2 \right), \quad i = 1, \dots, n \quad (5)$

其中， $x_i$ 表示模拟数据集中的高分辨率多光谱图像， $n$ 是全色图像 $P$ 的像素数。 $\varepsilon_0^2$ 是一个超参数，用于捕捉 $x$ 和 $F$ 之间的差距，在实验中可以设置为接近零的极小值。

受变分图像超分辨率方法 VIRNet [44] 的启发，我们以与 VIRNet 相同的形式分别对 $\sigma_i^2$ 和 $K$ 的共轭先验进行建模。我们选择逆伽马分布作为 $\sigma_i^2$ 的共轭先验，并简化为：

$\sigma_i^2 ∼ \mathcal{IG} \left( \sigma_i^2 \big| \alpha_0 - 1, \alpha_0 \xi_i \right), \quad i = 1, \dots, d \quad (6)$

其中， $\alpha_0$ 是控制分布形状的超参数， $\xi_i$ 表示通过训练数据使用高斯滤波器估计的噪声方差。

根据各向异性高斯模糊的性质，给定核大小，模糊核 $K$ 可以由协方差矩阵 $\Sigma$ 唯一确定。因此，模糊核可以表示为：

$k_{ij} = \frac{1}{2\pi \lambda_1 \lambda_2 \sqrt{1 - \rho^2}} \exp \left( -\frac{1}{2} S^T \Sigma^{-1} S \right)$
$\Sigma = \begin{pmatrix} \lambda_1^2 & \lambda_1 \lambda_2 \rho \\ \lambda_1 \lambda_2 \rho & \lambda_2^2 \end{pmatrix} \quad (7)$

其中， $\rho$ 表示皮尔逊相关系数， $\lambda_1$ 和 $\lambda_2$ 分别表示高斯分布在两个方向上的方差。 $S$ 表示模糊核作用的空间点坐标，当核大小为 $\times (2r + 1)$ 时， $S$ 的范围为 ([-r, r])。

为了便于后续的变分推断，我们将协方差矩阵中的三个变量表示为：

$\Lambda = \left\{ \lambda_1^2, \lambda_2^2, \rho \right\} \quad (8)$

模糊核 $K$ 的最终概率分布可以表示为：

$G(\Lambda)$
$\Lambda = \mathcal{N} \left( \rho \big| \hat{\rho}, r_0^2 \right) \prod_{l=1}^2 \mathcal{IG} \left( \lambda_l^2 \big| \kappa_0 - 1, \kappa_0 * \hat{\lambda}_l^2 \right) \quad (9)$