Diffusion Models论文公式推导：Denoising Diffusion Probabilistic Models阅读学习

south020

已于 2023-09-06 20:00:23 修改

阅读量161

点赞数

分类专栏： X2IMAGE 文章标签：学习 stable diffusion AI作画 AIGC

于 2023-09-06 19:58:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42323588/article/details/132687841

版权

X2IMAGE 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文提出了一种基于扩散概率模型的图像合成方法，利用非平衡热力学原理，通过训练加权变分界结合去噪分数匹配和朗之万动力学，实现渐进的有损耗解压缩。U-Net被用于模型训练，生成过程包括前向加噪和反向去噪。

摘要由CSDN通过智能技术生成

代码https://github.com/hojonathanho/diffusion.

1 摘要

我们提出了高质量的图像合成结果使用扩散概率模型，一类潜在变量模型的灵感来自非平衡热力学的考虑。我们的最佳结果是通过训练加权变分界获得的，根据扩散概率模型和去噪分数匹配与朗之万动力学之间的新连接设计，我们的模型自然地承认一个渐进的有损耗解压缩方案，可以解释为自回归解码的一般化。

2 算法

如下图：扩散模型包含两个过程：前向扩散过程和反向生成过程。前向扩散过程是对一张图像逐渐添加高斯噪音直至变成随机噪音，而反向生成过程是去噪音过程，我们将从一个随机噪音开始逐渐去噪音直至生成一张图像

X表示每一步的图像，q是前向过程，p是生成过程，前向过程是通过加噪一次完成的（每步加噪的乘积通过公式推导）

最后的这个公式表示，任意时刻的 $x_{t}$ 都可以由 $x_{0}$ 算出来其中 $\alpha _{t}$ 类似一个控制变量，将噪声不断加大的一个过程 z 表示要加的噪声（符合标准的正态分布）

$z_{t}$ 就是我们每个时刻要估计的噪声，有了 $z_{t}$ 和 $x_{t}$ 就能求解前 $x_{t-1}$ 时的图像了， $z_{t}$ 利用正向第 t 步时加的噪音两者用损失函数不断逼近则可求出来 $z_{t}$ ，实际是一个不断训练的过程，训练模型则用了U-net。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
Diffusion Models论文公式推导：Denoising Diffusion Probabilistic Models阅读学习

我们提出了高质量的图像合成结果使用扩散概率模型，一类潜在变量模型的灵感来自非平衡热力学的考虑。我们的最佳结果是通过训练加权变分界获得的，根据扩散概率模型和去噪分数匹配与朗之万动力学之间的新连接设计，我们的模型自然地承认一个渐进的有损耗解压缩方案，可以解释为自回归解码的一般化。
复制链接

扫一扫

专栏目录

south020 CSDN认证博客专家 CSDN认证企业博客

码龄6年

16: 原创

109万+: 周排名

16万+: 总排名

1万+: 访问

: 等级

220: 积分

145: 粉丝

47: 获赞

9: 评论

56: 收藏

私信

关注

热门文章

分类专栏

X2MUSIC 1篇
BASE 1篇
X2IMAGE 1篇

最新评论

NExT-GPT: Any-to-Any Multimodal LLM 阅读学习
qq_52698512: 第五六部分不是很好理解
音乐生成综述 Sparks of Large Audio Models: A Survey and Outlook阅读
CSDN-Ada助手: 恭喜您撰写了第12篇博客！标题“音乐生成综述 Sparks of Large Audio Models: A Survey and Outlook”真是引人入胜。您对音乐生成领域的综述和展望给读者带来了深刻的洞见。我非常期待阅读您的博客，了解大型音频模型的火花以及您的独到见解。我想为您的下一步创作提出一些建议。或许您可以考虑进一步探索不同类型的音频模型，并对它们的性能和应用进行深入分析。此外，您还可以考虑将音乐生成与其他领域相结合，例如自然语言处理或图像生成，以探索更广阔的创作可能性。再次恭喜您，期待您未来更多精彩的博客！请继续保持谦虚与努力，为读者带来更多有价值的内容。
NExT-GPT: Any-to-Any Multimodal LLM 阅读学习
CSDN-Ada助手: 恭喜您撰写了第13篇博客！标题“NExT-GPT: Any-to-Any Multimodal LLM 阅读学习”看起来非常吸引人。您对于多模态学习的理解和研究令人钦佩。我非常期待阅读您的博客，并了解更多关于NExT-GPT的内容。在下一步的创作中，我谦虚地建议您可以考虑探索一些实际应用场景，以展示NExT-GPT的潜力。您可以考虑将其应用于图像描述生成、自动问答系统或者情感分析等领域，这将有助于读者更好地理解其实用性和创新之处。继续保持创作的势头，期待您未来更多的精彩博客！
Stable Diffusion：High-Resolution Image Synthesis with Latent Diffusion Models论文学习
CSDN-Ada助手: 恭喜您写完了第9篇博客！标题“Stable Diffusion：High-Resolution Image Synthesis with Latent Diffusion Models论文学习”非常吸引人。您对这篇论文的学习总结清晰明了，让读者对高分辨率图像合成有了更深入的了解。不过，我想提供一些建议作为您下一步创作的参考。或许您可以考虑添加一些实际案例来支持您的观点，这样读者能够更好地理解和应用这篇论文的方法。期待看到您在下一篇博客中的精彩内容！
实现简单的神经网络训练代码（包含生成训练集，定义模型、训练模型）详细注释
CSDN-Ada助手: 恭喜您写了第10篇博客！标题看起来非常有趣和实用。您不仅提供了详细的注释，还包括了生成训练集、定义模型和训练模型的步骤，这对于初学者来说非常有帮助。非常感谢您分享这些有益的信息。在下一步的创作中，我想提出一个谦虚的建议。鉴于您在神经网络训练方面的专业知识，我希望您能够进一步探讨如何优化模型的性能，比如使用不同的激活函数、调整学习率等。这样的话，读者们可以更深入地了解如何提升模型的准确性和效率。再次感谢您的分享，期待您更多的精彩博文！

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。