ddpm Denoising Diffusion Probabilistic Model 学习笔记

AI算法网奇

已于 2024-05-16 14:13:38 修改

阅读量492

点赞数 22

分类专栏：深度学习基础文章标签：学习笔记人工智能

于 2024-05-13 17:13:37 首次发布

本文链接：https://blog.csdn.net/jacke121/article/details/138808815

版权

深度学习基础专栏收录该内容

175 篇文章 17 订阅

订阅专栏

Stable Diffusion

文章的贡献抽象出来就两个

潜空间上做扩散生成

ddpm(Denoising Diffusion Probabilistic Model)学习笔记

（1）利用前一时刻的 xt-1 得到任意时刻的噪声图片 xt（重参数化技巧）

ddpm条件生成图片即生成指定图片

Stable Diffusion

文章的贡献抽象出来就两个

：1）提出可以在潜空间上用diffusion学特征分布，而不是直接让diffusion 学图像，降低了diffusion模型的难度；2）可以用 cross-attention 方法给模型加条件搞条件生成，在 cross-attention 中，q来源于与上一步，k和v来源于条件编码。

潜空间上做扩散生成

之前的DM（diffusion model）大多是直接对图像做去噪扩散，生成出来的图像细节不太好，如果想生成高清大图又需要非常大的计算量。所以这里作者提出了一种在潜空间上做扩散生成的方式，另外还增加了文本条件生成。这些操作使得模型最终可以生成非常高清的图，而且跟像素级的DMs模型相比大大降低了计算量。

作者的贡献有：

1）与以往纯transformer的结构不同，作者的模型可以更优雅地扩展到更高纬度的数据，因此此工作可以（a）在压缩了的级别上提供更可靠更具体的重建细节，（b）可以更有效地生成百万像素高清图像。