长度为T的固定马尔可夫链的反向过程

最新推荐文章于 2024-10-18 20:21:36 发布

小西柚code

最新推荐文章于 2024-10-18 20:21:36 发布

阅读量932

点赞数 18

文章标签：计算机视觉人工智能深度学习

本文链接：https://blog.csdn.net/m0_52275819/article/details/142110951

版权

扩散模型是一种概率模型，旨在通过逐渐去噪正态分布变量来学习数据分布，这相当于学习长度为T的固定马尔可夫链的反向过程。那什么是长度为T的固定马尔可夫链的反向过程呢？

基本概念

马尔可夫链：马尔可夫链是一系列状态的序列，其中每个状态只依赖于前一个状态，而不依赖于更早的状态。这个特性称为“马尔可夫性质”。
长度为 T 的马尔可夫链：这意味着整个过程有 T 个状态，从初始状态开始，经过T−1 次转移，到达最后一个状态。
正向过程：在扩散模型中，正向过程指的是从一个初始数据开始，逐步增加噪声，直到最后状态变成完全随机的噪声。这是一个加噪过程。
反向过程：反向过程则是从完全随机的噪声开始，逐步去噪，直到恢复到初始数据。这是一个去噪过程。

整个扩散过程不是很理解看这里，很快就能懂：

扩散模型的基本概念小白版-CSDN博客

马尔代夫链：

马尔可夫链模型--通俗_马尔代夫链-CSDN博客

正向过程与反向过程

正向过程：假设我们有一个初始数据 $x_{0}$ ，通过一系列加噪步骤，最终得到一个完全由噪声构成的数据 $x_{T}$ 。每一步都可以用转移概率来描述，即 $p(x_{t+1}|x_{t})$ ，表示从状态 $x_{t}$ 到状态 $x_{t+1}$ 的概率。
反向过程：反向过程则是相反的方向，从 $x_{T}$ 开始，逐步去噪回到 $x_{0}$ 。每一步也可以用转移概率来描述，即 $q(x_{t-1})|x_{t}$ ，表示从状态 $x_{t}$ 回到状态 $x_{t-1}$ 的概率。

应用实例

假设我们有一个长度为 5 的固定马尔可夫链，用于图像生成：

初始状态：我们有一张清晰的图像 $x_{0}$ 。
正向过程：我们逐步对图像添加噪声，得到 $x_{1},x_{2},x_{3},x_{4}$ ，直到 $x_{5}$ 是一个完全随机的噪声图像。
反向过程：从 $x_{5}$ 开始，逐步去噪，恢复到 $x_{4},x_{3},x_{2},x_{1}$ ，最终回到 $x_{0}$ ，即原始图像。

训练过程

在训练扩散模型时，我们希望模型能够学习如何进行有效的去噪。具体来说，我们训练一个神经网络来预测每一步应该去除的噪声，从而使 $x_{t}$ 更接近 $x_{t-1}$ 。这个预测过程可以通过最小化预测分布 $p_{\theta }(x_{t-1}|x_{t})$ 和真实分布 $q(x_{t-1}|x_{t})$ 之间的差异来实现，通常使用 KL 散度作为损失函数。