Stable Diffusion之最全详解图解

最新推荐文章于 2025-03-21 10:38:28 发布

完颜振江

最新推荐文章于 2025-03-21 10:38:28 发布

阅读量1.3k

点赞数 31

文章标签： stable diffusion

本文链接：https://blog.csdn.net/ethnicitybeta/article/details/140146788

版权

Stable Diffusion 是一种生成图像模型，属于扩散模型的一种。它利用扩散过程生成图像，从而在图像生成和编辑任务中表现出色。以下是对 Stable Diffusion 的详细解释和图解：

Stable Diffusion 是一种基于扩散过程的图像生成模型。扩散过程包括两个主要步骤：正向扩散和逆向扩散。

数据准备:
- 使用大量图像数据训练模型。
- 数据集可以包括各种类型的图像，如自然场景、人像、物体等。
正向扩散过程:
- 从初始图像 (x_0) 开始，在每一步 (t) 加入一定量的高斯噪声，生成加噪后的图像 (x_t)。
- 这个过程由一个确定的扩散方程描述：
  [
  q(x_t | x_{t-1}) = \mathcal{N}(x_t; \sqrt{\alpha_t} x_{t-1}, (1 - \alpha_t) \mathbf{I})
  ]
逆向扩散过程:
- 从纯噪声 (x_T) 开始，逐步去噪，生成新的图像 (x_0)。
- 这个过程由一个逆扩散方程描述：
  [
  p(x_{t-1} | x_t) = \mathcal{N}(x_{t-1}; \mu_\theta(x_t, t), \Sigma_\theta(x_t, t))
  ]
模型训练:
- 使用变分推理训练模型，通过最小化KL散度来优化模型参数。
- 目标是使生成的图像尽可能接近真实图像。