代码https://github.com/hojonathanho/diffusion.
1 摘要
我们提出了高质量的图像合成结果使用扩散概率模型,一类潜在变量模型的灵感来自非平衡热力学的考虑。我们的最佳结果是通过训练加权变分界获得的,根据扩散概率模型和去噪分数匹配与朗之万动力学之间的新连接设计,我们的模型自然地承认一个渐进的有损耗解压缩方案,可以解释为自回归解码的一般化。
2 算法
如下图:扩散模型包含两个过程:前向扩散过程和反向生成过程。前向扩散过程是对一张图像逐渐添加高斯噪音直至变成随机噪音,而反向生成过程是去噪音过程,我们将从一个随机噪音开始逐渐去噪音直至生成一张图像
X表示每一步的图像,q是前向过程,p是生成过程,前向过程是通过加噪一次完成的(每步加噪的乘积通过公式推导)
最后的这个公式表示,任意时刻的都可以由算出来其中类似一个控制变量,将噪声不断加大的一个过程 z 表示要加的噪声(符合标准的正态分布)
就是我们每个时刻要估计的噪声,有了和就能求解前时的图像了,利用正向第 t 步时加的噪音两者用损失函数不断逼近则可求出来,实际是一个不断训练的过程,训练模型则用了U-net。