『扩散模型』参数化之v-prediction

一只楚楚猫

已于 2024-11-07 20:45:36 修改

阅读量2k

点赞数 30

分类专栏：深度学习扩散模型文章标签：深度学习扩散模型

于 2024-10-24 11:42:17 首次发布

本文链接：https://blog.csdn.net/julac/article/details/143204324

版权

文章目录

扩散模型
- 逆向扩散过程
- - v-prediction公式推导
  - 如何在扩散模型中应用v-prediction？
参考文献

扩散模型

逆向扩散过程

自从 DDPM 以来，扩散模型的参数化形式一般都是 $\epsilon$ -prediction，即通过预测噪声计算损失并更新扩散模型的参数
但是直接预测噪声 $\epsilon$ 往往会遇到不稳定或不易学习的问题：噪声 $\epsilon$ 本身是随机的，直接优化可能会导致大的不确定性

v-prediction公式推导

《PROGRESSIVE DISTILLATION FOR FAST SAMPLING OF DIFFUSION MODELS》（ICLR2022、CCF-A）
在这里插入图片描述
在DDPM中，加噪公式为 $\mathbf{x}_{t}=\sqrt{\bar{\alpha}_{t}}\mathbf{x}_{0}+\sqrt{1-\bar{\alpha}_{t}}\epsilon$ ，可以看到 $x_0$ 和 $\epsilon$ 前面的权重系数的平方和为1，和 $sin(\phi)^2+cos(\phi)^2=1$ 类似，所以我们可以把这两个权重系数当作单位圆半径向量在x轴和y轴上的投影，也就是上图所示的 $\alpha$ 和 $\sigma$ $\Rightarrow$ $\mathbf{z_{t}}=\alpha_{t}\mathbf{x}_0+\sigma_{t}\epsilon$ ，其中 $\mathbf{x}_0$ 是DDPM中的 $x_0$ 、 $\alpha_t$ 是DDPM中的 $\sqrt{\bar{\alpha}_{t}}$ 、 $z_t$ 是DDPM中的 $x_t$ 、 $\sigma_t$