Paper——Diffusion Model前向过程和反向过程详解

最新推荐文章于 2025-03-04 20:36:31 发布

Irving.Gao

最新推荐文章于 2025-03-04 20:36:31 发布

阅读量3.7k

点赞数 2

分类专栏： Paper 文章标签：人工智能深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45779334/article/details/128970371

版权

Paper 专栏收录该内容

14 篇文章

订阅专栏

文章详细介绍了Diffusion过程，包括前向过程如何逐步添加高斯噪声到原始图像，形成纯噪声图像，以及反向过程如何利用神经网络进行去噪，恢复原始图像。损失函数用于优化这一过程。此外，提到了U-Net和Attention机制在反向过程中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

Diffusion过程解析

前向和后向相互独立，前向过程使用马尔科夫链实现，反向过程采用神经网络进行预测。

前向过程

在这里插入图片描述

输入一个原始图片；
每一步添加噪声，噪声服从高斯分布（均值为0，方差为1，记作 $N (0, 1)$ ，服从正态分布）；
最终得到一个只含有噪声的图像；

公式详解

每一步增加噪声的求解

$X_t = \sqrt{a_t} X_{t-1} + \sqrt{1-a_t} \varepsilon_t$

$X_t$ 是当前时刻的图像； $X_{t-1}$ 是前一时刻的图像；
$a_t$ 是噪声权重，随着 $t$ 的增加不断变化（论文中是从0.0001到0.02）；
$\varepsilon_t$ 是指每个时刻添加的独立的高斯噪声。

从起始状态到最终状态的公式

在这里插入图片描述

反向过程

反向过程是通过参数化的U-Net+Attention神经网络实现从噪声图像到原始图像的denoise。

在这里插入图片描述

损失函数

最小化该公式：

$\left\|\bar{z}_t-z_\theta\left(\sqrt{\bar{\alpha}_t} x_0+\sqrt{1-\bar{\alpha}_t} \bar{z}_t, t\right)\right\|$

$\bar{z}_t$ 为 $t$ 时刻的噪声真值；
$z_\theta$ 为噪声预测值；
$\bar{\alpha}_t$ 为噪声参数，和 $t$ 有关；

总结公式

在这里插入图片描述

参考资料：

视频讲解：Diffusion Model：比“GAN"还要牛逼的图像生成模型！公式推导+论文精读，迪哥打你从零详解扩散模型！

代码资料

链接：https://pan.baidu.com/s/1P1WTZtr5UBLu9FVDXCk3nA?pwd=tuh4
提取码：tuh4

文字原理详解：由浅入深了解Diffusion Model
代码：https://github.com/zoubohao/DenoisingDiffusionProbabilityModel-ddpm-

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。