生成扩散模型漫谈：DDIM = 高观点DDPM

最新推荐文章于 2024-03-28 13:15:43 发布

VIP文章 PaperWeekly

最新推荐文章于 2024-03-28 13:15:43 发布

阅读量5.6k

点赞数

文章标签：机器学习人工智能深度学习计算机视觉神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/126168805

版权

©PaperWeekly 原创 · 作者 | 苏剑林

单位 | 追一科技

研究方向 | NLP、神经网络

相信很多读者都听说过甚至读过克莱因的《高观点下的初等数学》[1] 这套书，顾名思义，这是在学到了更深入、更完备的数学知识后，从更高的视角重新审视过往学过的初等数学，以得到更全面的认知，甚至达到温故而知新的效果。类似的书籍还有很多，比如《重温微积分》[2]、《复分析：可视化方法》[3] 等。

回到扩散模型，目前我们已经通过三篇文章从不同视角去解读了DDPM，那么它是否也存在一个更高的理解视角，让我们能从中得到新的收获呢？当然有，《Denoising Diffusion Implicit Models》[4] 介绍的 DDIM 模型就是经典的案例，本文一起来欣赏它。

思路分析

在《生成扩散模型漫谈：DDPM = 贝叶斯 + 去噪》中，我们提到过该文章所介绍的推导跟 DDIM 紧密相关。具体来说，文章的推导路线可以简单归纳如下：

这个过程是一步步递进的。然而，我们发现最终结果有着两个特点：

1. 损失函数只依赖于；

2. 采样过程只依赖于。

也就是说，尽管整个过程是以为出发点一步步往前推的，但是从结果上来看，压根儿就没的事。那么，我们大胆地“异想天开”一下：

高观点1：既然结果跟无关，可不可以干脆“过河拆桥”，将从整个推导过程中去掉？

DDIM 正是这个“异想天开”的产物！

待定系数

可能有读者会想，根据上一篇文章所用的贝叶斯定理：

没有给定怎么能得到？这其实是思维过于定式了，理论上在没有给定的情况下，的解空间更大，某种意义上来说是更加容易推导，此时它只需要满足边际分布条件：

我们用待定系数法来求解这个方程。在上一篇文章中，所解出的是一个正态分布，所以这一次我们可以更一般地设：

其中都是待定系数，而为了不重新训练模型，我们不改变和，于是我们可以列出：

其中，并且由正态分布的叠加性我们知道。对比的两个采样形式，我们发现要想（1）成立，只需要满足两个方程：

最低0.47元/天解锁文章

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
生成扩散模型漫谈：DDIM = 高观点DDPM

©PaperWeekly 原创 ·作者 | 苏剑林单位 | 追一科技研究方向 | NLP、神经网络相信很多读者都听说过甚至读过克莱因的《高观点下的初等数学》[1]这套书，顾名思义，这是在学到了更深入、更完备的数学知识后，从更高的视角重新审视过往学过的初等数学，以得到更全面的认知，甚至达到温故而知新的效果。类似的书籍还有很多，比如《重温微积分》[2]、《复分析：可视化方...
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。