扩散模型的添加噪声（前向过程）并逆向去噪（后向过程）

最新推荐文章于 2024-07-24 20:39:13 发布

six.学长

最新推荐文章于 2024-07-24 20:39:13 发布

阅读量948

点赞数 12

分类专栏：扩散模型文章标签：机器学习

本文链接：https://blog.csdn.net/m0_51200050/article/details/140248613

版权

11 篇文章 0 订阅

订阅专栏

扩散模型是一类生成模型，主要用于图像生成和其他生成任务。这类模型的核心思想是通过逐步添加噪声（前向过程）并逆向去噪（后向过程）来生成数据。下面将详细解释扩散模型的前向和后向传播，并提供具体数据举例。

在前向过程中，扩散模型从一个真实的数据分布开始，通过逐步添加高斯噪声，将数据转换成一种标准的高斯分布。具体步骤如下：

初始数据：假设我们有一个数据样本 $x_0$ 来自真实分布 $q(x_0)$ 。
逐步添加噪声：在每一步 $t$ 中，我们将高斯噪声添加到数据中，生成新的数据样本 $x_t$ 。这个过程可以表示为：
$x_t = \sqrt{\alpha_t} x_{t-1} + \sqrt{1 - \alpha_t} \epsilon_t$
其中， $\epsilon_t$ 是标准高斯噪声， $\alpha_t$ 是一个逐渐减小的参数，控制噪声的强度。
前向过程公式详解文章链接

假设我们有一个二维数据点 $x_0 = [1, 1]$ 。我们选择 $\alpha_t = 0.9$ ，并在前向过程中进行三步噪声添加。

第1步：
$x_1 = \sqrt{0.9} \cdot [1, 1] + \sqrt{0.1} \cdot \epsilon_1$
假设 $\epsilon_1 \sim \mathcal{N}(0, I)$ ，且 $\epsilon_1 = [0.2, -0.3]$ 。
$x_1 = \sqrt{0.9} \cdot [1, 1] + \sqrt{0.1} \cdot [0.2, -0.3] = [0.95, 0.95] + [0.063, -0.095] = [1.013, 0.855]$
第2步：
$x_2 = \sqrt{0.9} \cdot [1.013, 0.855] + \sqrt{0.1} \cdot \epsilon_2$
假设 $\epsilon_2 \sim \mathcal{N}(0, I)$ ，且 $\epsilon_2 = [-0.1, 0.1]$ 。
$x_2 = \sqrt{0.9} \cdot [1.013, 0.855] + \sqrt{0.1} \cdot [-0.1, 0.1] = [0.962, 0.811] + [-0.032, 0.032] = [0.930, 0.843]$
第3步：
$x_3 = \sqrt{0.9} \cdot [0.930, 0.843] + \sqrt{0.1} \cdot \epsilon_3$
假设 $\epsilon_3 \sim \mathcal{N}(0, I)$ ，且 $\epsilon_3 = [0.1, -0.2]$ 。
$x_3 = \sqrt{0.9} \cdot [0.930, 0.843] + \sqrt{0.1} \cdot [0.1, -0.2] = [0.883, 0.801] + [0.032, -0.063] = [0.915, 0.738]$

经过多次迭代后，数据点逐渐变得噪声化，趋近于高斯分布。

后向过程的目标是从标准高斯分布中逐步去噪，恢复到原始数据分布。这个过程是前向过程的逆过程，通过学习一个去噪模型 $p_\theta(x_{t-1} | x_t)$ 实现。

从高斯噪声开始：假设我们从一个标准高斯分布 $x_T \sim \mathcal{N}(0, I)$ 开始。
逐步去噪：在每一步 $t$ 中，我们使用训练好的模型 $p_\theta$ 预测并去除噪声，生成新的数据样本 $x_{t-1}$ 。这个过程可以表示为：
$x_{t-1} = \frac{1}{\sqrt{\alpha_t}} (x_t - \sqrt{1 - \alpha_t} \epsilon_\theta(x_t, t))$
其中， $\epsilon_\theta(x_t, t)$ 是模型预测的噪声。

假设我们从一个高斯噪声数据点 $x_3 = [0.915, 0.738]$ 开始，使用去噪模型进行逆过程。

第3步：
$x_2 = \frac{1}{\sqrt{0.9}} (x_3 - \sqrt{0.1} \epsilon_\theta(x_3, 3))$
假设模型预测的噪声 $\epsilon_\theta(x_3, 3) = [0.1, -0.2]$ 。
$x_2 = \frac{1}{\sqrt{0.9}} ([0.915, 0.738] - \sqrt{0.1} \cdot [0.1, -0.2]) = \frac{1}{\sqrt{0.9}} ([0.915, 0.738] - [0.032, -0.063]) = \frac{1}{\sqrt{0.9}} [0.883, 0.801] = [0.930, 0.843]$
第2步：
$x_1 = \frac{1}{\sqrt{0.9}} (x_2 - \sqrt{0.1} \epsilon_\theta(x_2, 2))$
假设模型预测的噪声 $\epsilon_\theta(x_2, 2) = [-0.1, 0.1]$ 。
$x_1 = \frac{1}{\sqrt{0.9}} ([0.930, 0.843] - \sqrt{0.1} \cdot [-0.1, 0.1]) = \frac{1}{\sqrt{0.9}} ([0.930, 0.843] + [0.032, -0.032]) = \frac{1}{\sqrt{0.9}} [0.962, 0.811] = [1.013, 0.855]$
第1步：
$x_0 = \frac{1}{\sqrt{0.9}} (x_1 - \sqrt{0.1} \epsilon_\theta(x_1, 1))$
假设模型预测的噪声 $\epsilon_\theta(x_1, 1) = [0.2, -0.3]$ 。
$x_0 = \frac{1}{\sqrt{0.9}} ([1.013, 0.855] - \sqrt{0.1} \cdot [0.2, -0.3]) = \frac{1}{\sqrt{0.9}} ([1.013, 0.855] - [0.063, -0.095]) = \frac{1}{\sqrt{0.9}} [0.95, 0.95] = [1, 1]$