生成扩散模型漫谈：W距离 ≤ 得分匹配

最新推荐文章于 2024-10-15 11:02:22 发布

PaperWeekly

最新推荐文章于 2024-10-15 11:02:22 发布

阅读量278

点赞数

文章标签：机器学习深度学习人工智能

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/129210568

版权

本文探讨了扩散模型与Wasserstein距离（W距离）的关系，揭示了扩散模型的得分匹配损失实际上是W距离的上界。通过数学推导，证明了优化扩散模型的损失函数与WGAN相似，都是在最小化两个分布的W距离。文章以直观的方式解释了这一理论发现，指出扩散模型在训练中间接最小化了数据分布与生成分布的W距离。

摘要由CSDN通过智能技术生成

©PaperWeekly 原创 · 作者 | 苏剑林

单位 | 追一科技

研究方向 | NLP、神经网络

Wasserstein 距离（下面简称“W距离”），是基于最优传输思想来度量两个概率分布差异程度的距离函数，笔者之前在《从Wasserstein距离、对偶理论到WGAN》等文章中也做过介绍。

对于很多读者来说，第一次听说 W 距离，是因为 2017 年出世的 WGAN [1]，它开创了从最优传输视角来理解 GAN 的新分支，也提高了最优传输理论在机器学习中的地位。很长一段时间以来，GAN [2] 都是生成模型领域的“主力军”，直到最近这两年扩散模型异军突起，GAN 的风头才有所下降，但其本身仍不失为一个强大的生成模型。

从形式上来看，扩散模型和 GAN 差异很明显，所以其研究一直都相对独立。不过，去年底的一篇论文《Score-based Generative Modeling Secretly Minimizes the Wasserstein Distance》[3] 打破了这个隔阂：它证明了扩散模型的得分匹配损失可以写成 W 距离的上界形式。这意味着在某种程度上，最小化扩散模型的损失函数，实则跟 WGAN 一样，都是在最小化两个分布的 W 距离。