生成扩散模型漫谈:DDPM = 贝叶斯 + 去噪

本文介绍了DDPM生成扩散模型的一种基于贝叶斯定理的推导方法,探讨了如何利用贝叶斯定理简化计算,并揭示其与DDIM模型的联系。通过去噪过程和预估修正的思想,解释了DDPM如何逐步从随机噪声生成样本数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

322e87c91f69f7313f41addc88e89741.gif

©PaperWeekly 原创 · 作者 | 苏剑林

单位 | 追一科技

研究方向 | NLP、神经网络

到目前为止,笔者给出了生成扩散模型 DDPM 的两种推导,分别是《生成扩散模型漫谈:DDPM = 拆楼 + 建楼》中的通俗类比方案和《生成扩散模型漫谈:DDPM = 自回归式 VAE》中的变分自编码器方案。两种方案可谓各有特点,前者更为直白易懂,但无法做更多的理论延伸和定量理解,后者理论分析上更加完备一些,但稍显形式化,启发性不足。

5e16c84d13f3c200a820a5604baa475a.jpeg

▲ 贝叶斯定理(来自维基百科)

在这篇文章中,我们再分享 DDPM 的一种推导,它主要利用到了贝叶斯定理来简化计算,整个过程的“推敲”味道颇浓,很有启发性。不仅如此,它还跟我们后面将要介绍的 DDIM 模型 [1] 有着紧密的联系。

7b35b93098dae82132b34384e628a069.png

模型绘景

再次回顾,DDPM 建模的是如下变换流程:

4bc4c27400398b5d1878f2eb5c3596ac.png

其中,正向就是将样本数据 逐渐变为随机噪声 的过程,反向就是将随机噪声 逐渐变为样本数据 的过程,反向过程就是我们希望得到的“生成模型”。

正向过程很简单,每一步是

3e18cf2b0d2e3fb545b174f220c4de09.png

或者写成

402 Payment Required

。在约束 之下,我们有

04d5516c27f0a73a634df17c1264a67a.png

从而可以求出

402 Payment Required

,其中 ,而 。

DDPM 要做的事情,就是从上述信息中求出反向过程所需要的 ,这样我们就能实现从任意一个 出发,逐步采样出 ,最后得到随机生成的样本数据 。

b04937cbc20c80c9d3976b29d8d0f9a7.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值