扩散模型的理解

星星超幸运

已于 2023-12-26 10:38:40 修改

阅读量584

点赞数 12

文章标签：计算机视觉自然语言处理

于 2023-12-20 17:09:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wantyingying/article/details/135112770

版权

先看看它干了啥，然后如果能应用到我的研究领域就好了。
生成，确实很火热的话题啊。还是转到这个方向好的哟。

http://t.csdnimg.cn/tQjQn这篇介绍挺好的

现在的几个问题：

（1）逆扩散为什么是未知的？

在原本p(x_{t-1}|x_t)中，计算过程用到了x0，但是x0是未知的（本身就是模型要求解生成的），用这个公式逆向就得到了x0的值，但是这个结果并不准确（是一个估计值。。。这里只能这样解释吧），但是其实这个噪声是可以保存的呀，不是分布，而是采样结果，那为什么又说不行？

它这段话固然解释了一些，但是问题是，那你直接用扩散过程的那个噪声就行啊，这个结果是可以保存下来的呀，不对，扩散过程的噪声是不知道的，因为是直接从x0一步到位x_t，但你现在推的是x_t到x_{t-1}。

那就是李宏毅老师的讲法了，逆过程求噪声之所以有效，是把1步转成了N步，不断迭代修正的。

（2）这个计算到底怎么实现的？

解释：它的意思是从x0得到了x_t（带根号的那串），然后我模型直接预测这个过程的噪声是多少。因为加了多少噪声是已知的（第4步）。推导公式的时候考虑的是要得到谁，但是算法和代码实现是一步到位的。

必须承认，这里我不会的根源还是在于，损失函数是怎么得来的。那一大串的KL散度推导实在是把我整蒙了，完全没明白。。。再说吧，还是得搞懂的，但暂时先往前推进吧

（3）在我看来，它就是预测了一个均值，为什么能得到一张图像的分布呢？难道每个像素点都是独立同分布的高斯吗？

（4）如果训练过程的开始，是一张随机初始化的噪声（图片），那么它为什么不直接搞前向传播出来的那张图作为初始呢？

解释1：就是前向传播出来的那张图作为初始的呀，是你理解错了算法1吧。它把原图加t步噪声的结果以及步长t作为模型的输入，输出是预测加的噪声长什么样。

解释2：但是推理的时候，是没有真实图片（让你前向加噪的），所以只能是一张随机噪声了。即算法2里面的x_t从标准高斯分布采样。

（5）测试过程（算法2）的解读？

【扩散模型 - Diffusion Model【李宏毅2023】】 https://www.bilibili.com/video/BV14c411J7f2/?p=3&share_source=copy_web&vd_source=297ebe5cc5e73d20786e36a6e64792b6

星星超幸运

博客等级

码龄6年

23
原创

61
点赞

54
收藏

48
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 数据集介绍

下一篇：: 扩散模型在文本生成中的应用

最新评论

vscode安装了中文语言不显示
qzynb: thx
怎么看tensor的类型
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
linux根据进程PID查询详细进程信息
CSDN-Ada助手: 恭喜你写了第18篇博客，标题看起来很有趣味性。我觉得你的博客内容一直很有深度，能够帮助读者解决实际问题。希望你在未来的创作中可以尝试一些更加高级的技巧，或者深入一些特定主题的研究，这样可以让你的博客更加全面，也能够吸引更多的读者。期待你接下来的创作！
关于np.corrcoef
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
扩散模型的理解
CSDN-Ada助手: 恭喜您写了第19篇博客！能够持续创作并分享您的理解对读者来说是一种福利。对于扩散模型的理解，您可以考虑进一步深入探讨不同类型的扩散模型，或者结合实际案例来分析扩散模型在现实生活中的应用。希望您能继续保持创作的热情，期待您更多的精彩分享！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。