[DDIM] Denoising Diffusion Implicit Models

emergency_rose

已于 2024-04-08 18:43:55 修改

阅读量421

点赞数 3

分类专栏： paper阅读笔记文章标签：人工智能

于 2024-04-08 18:43:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_30618203/article/details/132044308

版权

paper阅读笔记专栏收录该内容

63 篇文章

订阅专栏

文章探讨了DDPM生成图像的原理，提出DDIM方法通过减少推理次数，显著提高采样效率，同时保持生成质量。DDIM利用非马尔可夫过程，保持训练目标不变。实验显示DDIM在速度上比传统DDPM快10到50倍，且生成过程具备确定性，适合图像插值应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、目的

DDPM生成图像需要模拟Markov链，因此要经过多轮推理（因为条件概率仅仅与系统的当前状态相关），且推理过程是sequentially而不是parallel的

DDIM在不改变DDPM训练的基础上，减少了infer次数，在极大地增加了采样效率的同时，几乎不影响采样效果

2、方法

1）DDPM的一个重要特性是

因此目标函数为

该目标函数只用到 $q(x_{t}|x_{0})$ ，无须 $q(x_{1:T}|x_{0})$ 。因此可以选用一些non-Markovian过程，只要符合该边际分布即可。此时，训练objective不变，因此训练过程不变

DDIM选用的non-Markovian分布下，inference过程为

...... (1)

相应的forward过程可以表示为（但其实我们不需要前传的公式了）：

2）具体应用时，给定noisy $x_{t}$ ，先预测 $x_{0}$ ，

...... (2)

然后再结合公式1和公式2求解 $x_{t-1}$

即

其中，

当 $\eta = 1$ 时，是DDPM；当 $\eta = 0$ 时，是DDIM (denoising diffusion implicit model)

3）可以假定forward过程不定义在 $x_{1:T}$ 上，而是递增子集{ $x_{\tau_{1}}, ..., x_{\tau_{S}}$ }，并且符合如下边际分布

当这个(sampling) trajectory的长度远小于T时，就可以大大提升计算效率

3、效果

1）10 ~ 50X faster

2）生成过程是deterministic的，一旦确定了输入，则输出也是确定的。因此可以进行图像插值

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。