（三）4. 深度生成模型-扩散模型(连续时间“扩散模型”与“分数匹配”的关系)

小行星-

已于 2023-09-29 16:22:58 修改

阅读量511

点赞数 1

分类专栏：神经网络与深度学习文章标签：人工智能机器学习算法

于 2023-07-30 17:11:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40614311/article/details/131995379

版权

神经网络与深度学习专栏收录该内容

17 篇文章 61 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了连续时间扩散模型与分数匹配模型在理论上的关系，通过反向时间随机微分方程的理论证明，展示了两者在损失函数上的等价性。文章详细阐述了正向和反向随机微分方程的动态，以及分数函数的逼近方法，最后讨论了连续时间扩散模型与分数生成模型的等价性，揭示了最小化分数匹配损失与生成模型之间的联系。

摘要由CSDN通过智能技术生成

连续时间“扩散模型”与“分数匹配”的关系

1. 扩散模型和分数匹配模型（离散时间）
- 1.1. 扩散模型
- 1.2. 分数匹配模型
2. 基于分数的随机微分方程生成模型（连续时间）
3. 连续扩散模型与分数生成模型的等价性（损失函数）

离散时间扩散的生成模型和离散时间分数匹配方法在已经被证明有相同的损失函数。前文推出了连续时间扩散的生成模型，其中，损失函数的设定和分数匹配模型的损失函数相同，这尽管在实证上取得了成功，但理论基础仍然缺乏。

这篇博文首先给出了反向时间随机微分方程表达式的理论证明，然后证明了最大化连续时间扩散的生成模型似然函数的下界等同于最小化分数匹配损失，弥合了连续时间情形下两个模型的理论差距。

1. 扩散模型和分数匹配模型（离散时间）

1.1. 扩散模型

生成式建模可以被认为是一个反转的推理过程。

如果推理过程是可逆的，那么可以重点将数据转换为可处理的分布（Dinh et al.，2016）。
如果推理过程是确定性的但不可逆的，人们可以学会随机反转它(Dinh et al., 2019; Nielsen et al., 2020)。

最近关于基于扩散的建模的工作（Sohl-Dickstein等人，2015；Ho等人，2020）可以被认为是通过冻结变分自动编码器的推理路径来消除一个自由度。

了解本专栏

超级会员免费看

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小行星- 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。