Diffusion models 终极流程

最新推荐文章于 2024-07-21 12:40:56 发布

six.学长

最新推荐文章于 2024-07-21 12:40:56 发布

阅读量666

点赞数 7

分类专栏：扩散模型文章标签：人工智能

本文链接：https://blog.csdn.net/m0_51200050/article/details/140285617

版权

11 篇文章 0 订阅

订阅专栏

在这里插入图片描述

这张图片展示了两个算法，分别是用于训练和采样的。以下是这两个算法的解释：

这个算法描述了如何训练模型参数 $\theta$ 。

repeat: 训练过程是一个迭代的过程，重复以下步骤直到收敛。
$x_0 \sim q(x_0)$ : 从数据分布 $q(x_0)$ 中采样一个样本 $x_0$ 。
$\sim \text{Uniform}(\{1, \ldots, T\})$ : 从均匀分布 $\{1, \ldots, T\}$ 中随机选择一个时间步 $t$ 。
$\epsilon \sim \mathcal{N}(0, I)$ : 从标准正态分布 $\mathcal{N}(0, I)$ 中采样噪声 $\epsilon$ 。
梯度下降: 执行一次梯度下降步骤，优化目标是 $\|\epsilon - \epsilon_\theta(\sqrt{\bar{\alpha}_t}x_0 + \sqrt{1 - \bar{\alpha}_t}\epsilon, t)\|^2$ 。
直到收敛: 重复上述步骤直到模型收敛。

这个算法描述了如何从训练好的模型中生成样本。

$x_T \sim \mathcal{N}(0, I)$ : 从标准正态分布 $\mathcal{N}(0, I)$ 中采样初始样本 $x_T$ 。
for $\ldots, 1$ do: 从 $T$ 到 $1$ 依次执行以下步骤。
采样 $z$ : 如果 $t > 1$ ，从标准正态分布 $\mathcal{N}(0, I)$ 中采样噪声 $z$ ；否则 $z = 0$ 。
更新 $x_{t-1}$ : 使用公式 $x_{t-1} = \frac{1}{\sqrt{\alpha_t}} \left( x_t - \frac{1 - \alpha_t}{\sqrt{1 - \bar{\alpha}_t}} \epsilon_\theta(x_t, t) \right) + \sigma_t z$ 更新样本。
end for: 循环结束。
return $x_0$ : 返回生成的样本 $x_0$ 。