扩散模型基本原理

最新推荐文章于 2024-05-30 15:36:04 发布

pgsld2333

最新推荐文章于 2024-05-30 15:36:04 发布

阅读量429

点赞数

分类专栏： diffusion AIGC 文章标签：图像处理算法

本文链接：https://blog.csdn.net/pgsld2333/article/details/133081007

版权

diffusion 同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

AIGC

1 篇文章 0 订阅

订阅专栏

1 生成式模型基本思想

使用模型模拟真实世界的图像分布，可以学习神经网络模型，使其将标准正态分布的每个点映射到真实图像分布的点

2 扩散模型

2.1 正向过程

在这里插入图片描述从原始图像逐步添加噪声，最终得到近似完全噪声的图像
$q(x_t|x_{t-1})=N(\sqrt{1-\beta}x_{t-1};\beta \bold{I})$

$\beta\in[0,1]$ ， $\beta$ 值越大， $x_t$ 越接近于噪声；反之， $\beta$ 取值越小， $x_{t}$ 越接近于 $x_{t-1}$ .

当 $\varepsilon\sim N(0,\bold{I})$ 时， $\mu+\sigma\varepsilon\sim N(\mu,\sigma^2\bold{I})$ .
令 $\alpha=1-\beta$
$\begin{aligned}x_t&=\sqrt{\alpha_t}x_{t-1}+\sqrt{1-\alpha_t}z_1\\&=\sqrt{\alpha_t}(\sqrt{\alpha_{t-1}}x_{t-2}+\sqrt{1-\alpha_{t-1}}z_2)+\sqrt{1-\alpha_t}z_1\\&=\sqrt{\alpha_t\alpha_{t-1}}x_{t-2}+(\sqrt{\alpha_t-\alpha_t\alpha_{t-1}}z_2+\sqrt{1-\alpha_t}z_1)\end{aligned}$

由于
$z_1\sim N(0,\bold{I})$ $z_2\sim N(0,\bold{I})$
所以
$\sqrt{1-\alpha_t}z_1\sim N(0,(1-\alpha_t)\bold{I})$ $\sqrt{\alpha_t-\alpha_t\alpha_{t-1}}z_2\sim N(0,(\alpha_t-\alpha_t\alpha_{t-1})\bold{I})$
所以
$\sqrt{1-\alpha_t}z_1+\sqrt{\alpha_t-\alpha_t\alpha_{t-1}}z_2\sim N(0,(1-\alpha_t\alpha_{t-1})\bold{I})$
因此，可令 $\overline{z}_t\sim N(0,\bold{I})$ ， $\overline{a}_t=\prod^t_{i=1}{\alpha_i}$
$\begin{aligned}x_t&=\sqrt{\alpha_t\alpha_{t-1}}x_{t-2}+\sqrt{(1-\alpha_t\alpha_{t-1})}\overline{z}_2\\&=\sqrt{\overline{a}_t}x_{0}+\sqrt{1-\overline{\alpha}_{t-1}}\overline{z}_t\end{aligned}$