Metropolis-Hasting 算法 & 图上的Metropolis-Hasting Random Walk (MHRW)

最新推荐文章于 2024-05-08 10:02:29 发布

wzu12345678

最新推荐文章于 2024-05-08 10:02:29 发布

阅读量7.3k

点赞数 4

分类专栏： Graph-Mini 文章标签：算法

本文链接：https://blog.csdn.net/wzu12345678/article/details/74002353

版权

Graph-Mini 专栏收录该内容

1 篇文章

订阅专栏

背景介绍：

在概率与统计领域，往往需要根据已知的概率分布生成相应的采样集合，从而支持后续的统计分析与研究。有时候已知的概率分布比较简单，很容易生成一系列的采样集合，而有时候已获得的概率分布较为复杂，很难直接生成相应的采样集合。那么是否存在一种算法，不管给定的分布复杂与否，均可以统一的生成相应的采样集合呢？答案是肯定的。今天我们就将介绍一种普遍使用的算法：Metropolis-Hasting (MH) 算法。
MH算法名字中的Metropolis和Hasting分别代表两个人。其中，Nicholas Metropolis是1953年发表的论文Equation of State Calculations by Fast Computing Machines 中的第一作者。在这篇论文中为了讨论对称分布，首先提出了该算法。而在1970年，W. K. Hastings 将该算法扩展到一般情况，从而奠定了它的普适性。

Metropolis-Hasting 算法：

      MH算法是一个基于Markov Chain Monte Carlo(MCMC) 的近似算法。它实现的原理是首先根据给定的任意一个概率分布，构造一个以该分布为静态分布的Markov Chain，然后执行该Markov Chain 到达收敛之后（每个点被访问的概率服从静态分布）开始采样，此时获得的采样集合近似认为是服从给定分布 $\pi$ 的。
      从上述的原理描述，我们不难看出，算法所面临的挑战在于如何通过给定的分布 $\pi$ 来设计相应的Markov Chain？因为每一条Markov Chain都对应唯一的一个转移矩阵，所以该问题等价于如何根据 $\pi$ 确定转移概率矩阵。
      为了解决上述挑战，我们首先需要搞清楚什么样的转移概率矩阵对应的Markov Chain才会存在静态分布，以及是否该静态分布是唯一的？

1. 静态分布存在的一个充分不必要条件: 给定一条Markov Chain $\{X_{t}\}_{t\ge0}$ ，设其转移矩阵为 $P=\{p(i, j)\}_{i,j\in S}$ ，其中 $S$ 为状态空间， $p(i,j)$ 表示从转态 $i$ 到状态 $j$ 的一步转移概率。若存在一个分布 $\pi$ 满足： $p(i,j)\pi(i) = p(j,i)\pi(j)$ ，则 $\pi$ 是该Markov Chain的一个静态分布。同时称该链是time-reversible的。
2. 静态分布唯一存在的充分必要条件：若一条Markov Chain 是非周期（aperiodic）和常回归的（positive recurrent）的，等价于该链是可遍历的（ergodicity），则可以证明该链存在唯一的静态分布，

      上面的两个结论为我们如何根据分布 $\pi$ 设计转移矩阵指明了方向。换句话说，若我们能设计出满足上面两个条件的转移概率，其对应的Markov Chain一定存在唯一的静态分布，且该分布就是 $\pi$ 。通过利用第一个结论，我们可以得到1式：

p ( i , j ) p ( j , i ) = π ( j ) π ( i )

$\frac{p(i,j)}{p(j,i)} = \frac{\pi(j)}{\pi(i)}$
为了满足第二个结论，我们可以将每一步的转移概率分成两步：选举概率

Q(i,j) $Q(i,j)$ 和接受概率

A(i,j) $A(i,j)$ 。即每一次转移时，首先从

i $i$ 的相邻状态中随机选择一个状态

j $j$ 作为候选下一跳，然后以概率

A(i,j) $A(i,j)$ 接受它作为真正的下一跳。因此，我们有2式：

p (i, j) = Q (i, j) A (i, j)

$p(i,j) = Q(i,j)A(i,j)$
结合1式和2式，我们可以得到3式：

Q ( i , j ) A ( i , j ) Q ( j , i ) A ( j , i ) = π ( j ) π ( i )

$\frac{Q(i,j)A(i,j)}{Q(j,i)A(j,i)} = \frac{\pi(j)}{\pi(i)}$
进而，我们可以得到4式：

A (i, j) = π ( j ) Q ( j , i ) π ( i ) Q ( i , j ) * A (j, i)

$A(i,j) = \frac{\pi(j)Q(j,i)}{\pi(i)Q(i,j)} * A(j,i)$
记

T (j, i) = π ( j ) Q ( j , i ) π ( i ) Q ( i , j )

$T(j,i) = \frac{\pi(j)Q(j,i)}{\pi(i)Q(i,j)}$
从而我们有5式：

A(i,j)=T(j,i)A(j,i) $A(i,j)=T(j,i)A(j,i)$
结合

T(j,i) $T(j,i)$ 和5式，不难得出，

T(i,j)=1/T(j,i) $T(i,j) = 1/T(j,i)$ 和

A(i,j)=F(T(i,j)) $A(i,j)=F(T(i,j))$ ，其中

F $F$ 满足

F(x)=F(1/x)/x $F(x)=F(1/x)/x$ 。由于

F $F$ 不唯一，我们可以选择其中一个解

F(x)=min{1,x} $F(x) = min\{1,x\}$ 。最终，我们有：

A (i, j) = m i n {1, T (i, j)} = m i n {1, π ( j ) Q ( j , i ) π ( i ) Q ( i , j )}

$A(i,j) = min\{1, T(i,j)\} = min\{1,\frac{\pi(j)Q(j,i)}{\pi(i)Q(i,j)}\}$
到这里，我们便根据给定的分布

π $\pi$ ，完成了对转移概率的设计，即对任意的

j≠i $j\neq i$ ：

p (i, j) = Q (i, j) * m i n {1, π ( j ) Q ( j , i ) π ( i ) Q ( i , j )}

$p(i,j) = Q(i,j)*min\{1, \frac{\pi(j)Q(j,i)}{\pi(i)Q(i,j)}\}$
其中，

p(i,i)=1−p(i,j) $p(i,i) = 1 - p(i,j)$ 。

图上的Metropolis-Hasting Random Walk (MHRW)

作为一个具体的例子，接下来，我们将介绍在给定图上的基于MH算法的随机游走。
给定一个无向连通图 $G(V,E)$ ，其中 $V$ 是结点集合， $E$ 是边集合。对任意一个结点 $i$ ，记 $N(i)$ 为 $i$ 的邻居集合， $d(i)$ 为邻居个数。MHRW算法假定选举概率 $Q(i,j)=1/d(i)$ ，即随机均匀的从 $i$ 的邻居中选择一个。若假定给定的分布是均匀分布，即 $\pi(i)=1/|V|$ 。则我们有对任意的 $j\neq i$ ：

p (i, j) = 1 d ( i ) * m i n {1, d ( i ) d ( j )}

$p(i,j) = \frac{1}{d(i)}*min\{1, \frac{d(i)}{d(j)}\}$
具体的算法伪代码如下：

v ← initial node
while stopping criterion not met do
    Select node w uniformly at random from neighbors of v.
    Generate uniformly at random a number 0≤p≤1.
    if p < d(v)/d(w) then
        v ← w.
    else
        Stay at v
    end if
end while