Time reversal formula 和 Fokker-Planck, Kolmogorov 方程（1）

最新推荐文章于 2025-03-25 21:58:09 发布

James Iffen

最新推荐文章于 2025-03-25 21:58:09 发布

阅读量838

点赞数 16

分类专栏：随机过程文章标签：机器学习概率论

本文链接：https://blog.csdn.net/JamesYuyi/article/details/146133124

版权

随机过程专栏收录该内容

8 篇文章

订阅专栏

最近在研究 diffusion model，涉及到了 Time-reversal formula，reverse-time process，以及相关的一些随机过程、随机分析的理论知识，搞得头很晕，特意做了这篇整理。

关注的 SDE 如下

$dX_t=f(X_t,t)dt+g(X_t,t)dW_t,\tag{1}$

我们分别介绍 Forward Kolmogorov 方程和 Backward Kolmogorov 方程（这里就不用正向、倒向来描述了，避免中文带来的直观感觉与后面出现的 reverse-time 产生矛盾）

Forward Kolmogorov 方程为：对 $t\geqslant s$ ,
$-\dfrac{\partial p(x_t,t|x_s,s)}{\partial t}=\sum_i\dfrac{\partial}{\partial x_t^i}\left[p(x_t,t|x_s,s)f^i(x_t,t)\right]-\dfrac{1}{2}\sum_{i,j,k}\dfrac{\partial^2\left[g^{ik}(x_t,t)g^{jk}(x_t,t)p(x_t,t|x_s,s)\right]}{\partial x_t^i\partial x_t^j}$
由于偏导数是针对 $t$ 时刻的状态计算的，因此我们可以对 $x_s,s$ 条件直接积分，也即方程左右两边同乘 $p(x_s,s)$ 后对 $dx_s$ 积分，求偏导和积分运算交换后得到 Fokker-Planck 方程：
$-\dfrac{\partial p(x_t,t)}{\partial t}=\sum_i\dfrac{\partial}{\partial x_t^i}\left[p(x_t,t)f^i(x_t,t)\right]-\dfrac{1}{2}\sum_{i,j,k}\dfrac{\partial^2\left[g^{ik}(x_t,t)g^{jk}(x_t,t)p(x_t,t)\right]}{\partial x_t^i\partial x_t^j}$
对应的 Backward Kolmogorov 方程为：对 $s\geqslant t$
$-\dfrac{\partial p(x_s,s|x_t,t)}{\partial t}=\sum_i f^i(x_t,t)\dfrac{\partial p(x_s,s|x_t,t)}{\partial x_t^i}+\dfrac{1}{2}\sum_{i,j,k}g^{ik}(x_t,t)g^{jk}(x_t,t)\dfrac{\partial^2 p(x_s,s|x_t,t)}{\partial x_t^i\partial x_t^j}$
注意转移概率描述的还是 $X_t$ 到 $X_s$ 的转移概率，是正向的转移概率，但是方程中对 $t$ 和 $x_t$ 求偏导，描述的是初始状态的变化对转移概率的影响。

至此，我们先做一步总结：Kolmogorov 方程的主体都是正向转移概率的变化，Forward Kolmogorov 描述的是正向转移概率的末端变化，Backward Kolmogorov 描述的是正向转移概率的始端变化。（这都不是什么术语，只是我为了方便区分给出的命名）

我们开始进一步的研究：倒向转移概率，在后面的过程中，注意每一步都要明确时间的先后。我们要计算的是
$\dfrac{\partial p(x_t,t,x_s,s)}{\partial t},\quad s\geqslant t$
这里再强调一下，上面的联合分布 $t, s$ 的大小关系看起来不太重要，但重要的是，我们研究的是始端状态的变化 $\partial t$ ，事实上，如果研究末端变化，直接由 Forward Kolmogorov 方程两侧同乘 $p(x_s,s)$ 就得到了。而始端变化就稍微复杂些，我们计算
$\begin{align*} &\quad \dfrac{\partial p(x_t,t,x_s,s)}{\partial t}\\ &=\dfrac{\partial \left(p(x_s,s|x_t,t)p(x_t,t)\right)}{\partial t}\\ &=\dfrac{\partial p(x_s,s|x_t,t)}{\partial t}p(x_t,t)+p(x_s,s|x_t,t)\dfrac{\partial p(x_t,t)}{\partial t}\\ &=-p(x_t,t)\left[\sum_if^i(x_t,t)\dfrac{\partial p(x_s,s|x_t,t)}{\partial x_t^i}+\dfrac{1}{2}\sum_{i,j,k}g^{ik}(x_t,t)g^{jk}(x_t,t)\dfrac{\partial^2 p(x_s,s|x_t,t)}{\partial x_t^i\partial x_t^j}\right]\\ &\quad-p(x_s,s|x_t,t)\left[\sum_i\dfrac{\partial}{\partial x_t^i}\left[p(x_t,t)f^i(x_t,t)\right]-\dfrac{1}{2}\sum_{i,j,k}\dfrac{\partial^2\left[g^{ik}(x_t,t)g^{jk}(x_t,t)p(x_t,t)\right]}{\partial x_t^i\partial x_t^j}\right]\\ &=-\sum_i\dfrac{\partial}{\partial x_t^i}\left[f^i(x_t,t)p(x_t,t)p(x_s,s|x_t,t)\right]\\ &\quad -\dfrac{1}{2}\bigg[p(x_t,t)\sum_{i,j,k}g^{ik}(x_t,t)g^{jk}(x_t,t)\dfrac{\partial^2 p(x_s,s|x_t,t)}{\partial x_t^i\partial x_t^j}+2\sum_{i,j,k}\dfrac{\partial\left[p(x_t,t)g^{ik}(x_t,t)g^{jk}(x_t,t)\right]}{\partial x_t^i}\dfrac{\partial p(x_s,s|x_t,t)}{\partial x_t^j}\\ &\qquad\quad+p(x_s,s|x_t,t)\sum_{i,j,k}\dfrac{\partial^2\left[g^{ik}(x_t,t)g^{jk}(x_t,t)p(x_t,t)\right]}{\partial x_t^i\partial x_t^j}\bigg]\\ &\quad +p(x_s,s|x_t,t)\sum_{i,j,k}\dfrac{\partial^2\left[g^{ik}(x_t,t)g^{jk}(x_t,t)p(x_t,t)\right]}{\partial x_t^i\partial x_t^j}+\sum_{i,j,k}\dfrac{\partial\left[p(x_t,t)g^{ik}(x_t,t)g^{jk}(x_t,t)\right]}{\partial x_t^i}\dfrac{\partial p(x_s,s|x_t,t)}{\partial x_t^j}\\ &=-\sum_i\dfrac{\partial}{\partial x_t^i}\left[f^i(x_t,t)p(x_t,t,x_s,s)\right]\\ &\quad -\dfrac{1}{2}\sum_{i,j,k}\dfrac{\partial^2\left[p(x_t,t,x_s,s)g^{ik}(x_t,t)g^{jk}(x_t,t)\right]}{\partial x_t^i\partial x_t^j}\\ &\quad +\sum_{i,j,k}\dfrac{\partial}{\partial x_t^i}\left[p(x_s,s|x_t,t)\dfrac{\partial\left[p(x_t,t)g^{ik}(x_t,t)g^{jk}(x_t,t)\right]}{\partial x_t^j}\right]\\ &=-\sum_i\dfrac{\partial}{\partial x_t^i}\left[p(x_t,t,x_s,s)\cdot\left(f^i(x_t,t)-\dfrac{1}{p(x_t,t)}\sum_{j,k}\dfrac{\partial\left[p(x_t,t)g^{ik}(x_t,t)g^{jk}(x_t,t)\right]}{\partial x_t^j}\right)\right]\\ &\quad -\dfrac{1}{2}\sum_{i,j,k}\dfrac{\partial^2\left[p(x_t,t,x_s,s)g^{ik}(x_t,t)g^{jk}(x_t,t)\right]}{\partial x_t^i\partial x_t^j} \end{align*}$
如果整理一下系数，重新给定记号
$\bar f^i(x_t,t)=f^i(x_t,t)-\dfrac{1}{p(x_t,t)}\sum_{j,k}\dfrac{\partial}{\partial x_t^j}\left[p(x_t,t)g^{ik}(x_t,t)g^{jk}(x_t,t)\right]$
则有 $t\leqslant s$ ,
$-\dfrac{\partial p(x_t,t,x_s,s)}{\partial t}=\sum_i\dfrac{\partial}{\partial x_t^i}\left[\bar f^i(x_t,t)p(x_t,t,x_s,s)\right]+\dfrac{1}{2}\sum_{i,j,k}\dfrac{\partial^2\left[p(x_t,t,x_s,s)g^{ik}(x_t,t)g^{jk}(x_t,t)\right]}{\partial x_t^i\partial x_t^j}$
对应地，我们可以在等式两侧同除 $p(x_s,s)$ 或进一步对 $dx_s$ 积分，分别能够得到条件转移概率和边缘密度函数（对应 Fokker-Planck 方程形式）的两个等式：
$-\dfrac{\partial p(x_t,t|x_s,s)}{\partial t}=\sum_i\dfrac{\partial}{\partial x_t^i}\left[\bar f^i(x_t,t)p(x_t,t|x_s,s)\right]+\dfrac{1}{2}\sum_{i,j,k}\dfrac{\partial^2\left[p(x_t,t|x_s,s)g^{ik}(x_t,t)g^{jk}(x_t,t)\right]}{\partial x_t^i\partial x_t^j}$
以及
$-\dfrac{\partial p(x_t,t)}{\partial t}=\sum_i\dfrac{\partial}{\partial x_t^i}\left[\bar f^i(x_t,t)p(x_t,t)\right]+\dfrac{1}{2}\sum_{i,j,k}\dfrac{\partial^2\left[p(x_t,t)g^{ik}(x_t,t)g^{jk}(x_t,t)\right]}{\partial x_t^i\partial x_t^j}$
至此为止，我们做第二次总结：（1）我们仍然只关注了过程（1）的各种条件转移概率，边缘概率密度函数，所涉及的倒向概念，也只是针对该过程的时间先后，目前的随机过程的时间方向只有一个；（2）类比 Kolmogorov 方程，我们对倒向的转移概率 $p(x_t,t|x_s,s), t\leqslant s$ 给出了一个偏导方程，但注意，我们只描述了倒向的转移概率的关于 $t$ 的变化，关于 $s$ 的变化暂不讨论。