Diffusion Model（1）：预备知识

MaZhe丶

已于 2022-10-25 15:23:18 修改

阅读量537

点赞数

分类专栏：扩散模型深度学习文章标签：深度学习 1024程序员节

于 2022-10-24 16:32:45 首次发布

本文链接：https://blog.csdn.net/weixin_42363544/article/details/127493686

版权

深度学习同时被 2 个专栏收录

6 篇文章 2 订阅

订阅专栏

扩散模型

3 篇文章 3 订阅

订阅专栏

文章目录

- - Diffusion Model（1）：预备知识

Diffusion Model（1）：预备知识

一、贝叶斯公式

1. 条件概率: $p(X=x\vert Y=y)$ 是在已知 $Y = y$ 的条件下，计算 $X = x$ 的概率。

$\begin{equation} p(x|y) = \frac{p(x,y)}{p(y)}\\ p(x,y) = p(x|y)p(y) = p(y|x)p(x) \end{equation}$

如果 $x$ 和 $y$ 相互独立，则:
$\begin{equation} p(x|y)=p(x) \end{equation}$
多个变量情况下:
$\begin{equation} \begin{aligned} P(x,y,z)=P(z|y,x)P(y,x)=P(z|y,x)P(y|x)P(x)\\ P(y,z|x)= \frac{P(x,y,z)}{P(x)}=P(y|x)P(z|x,y) \end{aligned} \end{equation}$
2.基于马尔可夫假设的条件概率：

如果满足马尔科夫链关系 $A - > B - > C$ ，那么有
$\begin{equation} \begin{aligned} P(x,y,z)=&P(z|y,x)P(y,x)=P(z|y)P(y|x)P(x)\\ &P(y,z|x)=P(y|x)P(z|y) \end{aligned} \end{equation}$
3.全概率公式：

离散情况下:
$\begin{equation} p(x) = \sum_yp(x,y)=\sum_yp(x|y)p(y) \end{equation}$
连续情况下:
$\begin{equation} p(x)=\int p(x, y) d y=\int p(x|y) p(y) d y \end{equation}$
4.贝叶斯公式:

基于条件概率公式和全概率公式，可以推导出贝叶斯公式：
$\begin{aligned} P(x,y)&=P(x|y)P(y)=P(y|x)P(x)\\ P(x|y)&=\frac{P(y|x)P(x)}{P(y)}=\frac{causal\;knowledge \cdot\;prior\;knowledge}{prior \; knowledge} \end{aligned}$

其中 $x$ 一般是某种状态； $y$ 代表着某种观测
$P(y\vert x)$ 是 $causal\;knowledge$ ，即由已知 $x$ 的情况，就可以推算 $y$ 发生的概率
$P(x)\; P(y)$ 是 $prior\;knowledge$ ，是对 $x$ 概率的先验知识
$P(x\vert y)$ 是基于观测对状态的诊断或推断。贝叶斯公式的本质就是利用causal knowledge和prior knowledge来进行状态推断或推理。

当利用多种信息对一个状态进行猜测和推理时:
$\begin{equation} \begin{aligned} P(x|y,z)&=\frac{P(x,y,z)}{P(y,z)}\\ &=\frac{P(y|x,z)\;P(x,z)}{P(y|z)\;P(z)}\\ &=\frac{P(y|x,z)\;P(x|z)\;P(z)}{P(y|z)\;P(z)}\\ &=\frac{P(y|x,z)\;P(x|z)}{P(y|z)} \\ \end{aligned} \end{equation}$

二、重参数化

若希望从高斯分布 $N(\mu,\sigma)$ 中采样，可以先从标准正态分布 $N(0,\mathbf{I})$ 中采样出 $z$ ，再得到 $\sigma * z + \mu$ 。这样做的好处是将随机性转移到了 $z$ 这个常量上，而 $\sigma$ 和 $\mu$ 则是仿射变换网络的一部分。

三、KL散度

1.标准高斯分布概率分布：
$\begin{equation} \mathcal{N}\left(x ; \mu, \sigma^{2}\right)=\frac{1}{\sqrt{2 \pi} \sigma} \exp \left(-\frac{(x-\mu)^{2}}{2 \sigma^{2}}\right) \end{equation}$
2.KL散度：
$\begin{equation} D_{\text{KL}}(q(x) || p(x)) = \mathbb{E}_{q(x)} \log [q(x) / p(x)] \end{equation}$
当 $q (x)$ 和 $p (x)$ 均为高斯分布的时候，KL散度具有封闭形式的公式:
$\begin{equation} \begin{aligned} & D_{\text{KL}}(\mathcal{N}(\mu_1, \sigma_1^2) || \mathcal{N}(\mu_2, \sigma_2^2)) = \log\frac{\sigma_2}{\sigma_1} + \frac{{\sigma_1^2} + (\mu_1 - \mu_2)^2}{2\sigma_2^2} - \frac{1}{2} \end{aligned} \end{equation}$
以上是在Diffusion Model（DDPM）推到过程中会用到的公式。
References:
deep_thoughts bilibili

MaZhe丶

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Diffusion Model（1）：预备知识

以上是在Diffusion Model（DDPM）推到过程中会用到的公式。这样做的好处是将随机性转移到了。中采样，可以先从标准正态分布。如果满足马尔科夫链关系。则是仿射变换网络的一部分。若希望从高斯分布。
复制链接

扫一扫