从另一种简单的形式理解扩散模型原理和代码实践

正文

我们先来看一个简单的case。

有一组坐落在x轴的点集，最小和最大的数值为-4和4。我用浅绿色将这些点标记，记作 $X_0$
在这里插入图片描述
$X_0 \in \{(-4,0), (-3,0),(-2,0),(-1,0),(0,0),(1,0),(2,0),(3,0),(4,0) \}$
很明显， $X_0$ 分布的特点是9个点都坐落在X轴上，并且有大小范围约束。
那么，如果我们想将 $X_0$ 代表的线段分布变成半圆线段，该如何做呢？
用 $X_1$ 记作半圆线段对应的分布，学过高中数学的同学会想到圆形公式：
$x_0^2 + x_1^2 = 4^2 \\ x_1 = \sqrt {4^2 - x_0^2}$
这里我们只考虑正半轴的情况。因此，定义 $f(x)=42−x2f(x)=\sqrt {4^2 - x^2}$ 是将分布 $X_0$ 转为 $X_1$ 的精准映射函数
在这里插入图片描述
用红色的点集表示分布 $X_1$ 。

然而现实问题会更加复杂，我们往往找不到一个精准映射的函数，更多的问题是已知 $X_0$ 和 $X_1$ ，需要找到 $f$ 。因此考虑一种复杂的情况，已知X和Y，但不知道 $f$ ，如何让X分布映射到Y上。
有的同学可能想到了，我们可以设计一条轨迹，或者叫路径，让 $X_0$ 逐渐往 $X_1$ 上迁移，这个轨迹可能有很多步，我们假设第0步为0，最后一步为1。0-1之间的任意步骤都是轨迹上的中间态 $X_t$ 。
那我们可以设计一个最简单的路径，路径上的中间态 $X_t$ 为
$Xt=(1−t)×X0+t×X1X_t = (1-t) \times X_0 + t \times X_1$