[总结] DDPM Diffusion模型各阶段训练和采样过程方案细节和代码逻辑汇总

算法回顾

DDPM的算法概述
在这里插入图片描述

我们从 Classifier-Free Diffusion Guidance 这篇文章开始。
classifier-free 引导的条件采样过程
在这里插入图片描述
在《Null-text Inversion for Editing Real Images using Guided Diffusion Models》 中,对Classifier-free guidance 形式化为:
在这里插入图片描述
简单的推断一下:
= ω ∗ ϵ θ ( z t , t , C ) + ϵ θ ( z t , t , ⊘ ) − ω ∗ ϵ θ ( z t , t , ⊘ ) \omega * \epsilon_{\theta}(z_t,t,C)+\epsilon_{\theta}(z_t,t,\oslash )-\omega * \epsilon_{\theta}(z_t,t,\oslash ) ωϵθ(zt,t,C)+ϵθ(zt,t,)ωϵθ(zt,t,)
= ω ∗ ( ϵ θ ( z t , t , C ) − ϵ θ ( z t , t , ⊘ ) ) + ϵ θ ( z t , t , ⊘ ) \omega *( \epsilon_{\theta}(z_t,t,C)-\epsilon_{\theta}(z_t,t,\oslash ))+\epsilon_{\theta}(z_t,t,\oslash ) ω(ϵθ(zt,t,C)ϵθ(zt,t,))+ϵθ(zt,t,)

相当于是在 ϵ θ ( z t , t , ⊘ ) \epsilon_{\theta}(z_t,t,\oslash ) ϵθ(zt,t,)的基础上,加强了在 ϵ θ ( z t , t , C ) − ϵ θ ( z t , t , ⊘ ) \epsilon_{\theta}(z_t,t,C)-\epsilon_{\theta}(z_t,t,\oslash ) ϵθ(zt,t,C)ϵθ(zt,t,)方向上的引导,可以结合下图来进行理解:
在这里插入图片描述
Classifier-Free Diffusion Guidance 中的这张图也表达相同的意思,模型增加分类器指导强度时发生的Inception score增加和样本多样性减少的简化表现。
在这里插入图片描述

框架理解

下面画图理解一下Diffuion Model 发展各个阶段的方法

DDPM

训练过程

在这里插入图片描述

采样过程

在这里插入图片描述

Text-guiled DDPM

训练过程

在这里插入图片描述

采样过程

在这里插入图片描述

Null-text guiled DDPM

训练过程

和 text guiled DDPM一致。

采样过程

在这里插入图片描述

项目代码

下面是论文《GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models》的代码逻辑进行梳理,code 链接:https://github.com/openai/glide-text2im/

训练过程在这里插入图片描述

采样过程

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

_Summer tree

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值