上一节说了马尔可夫链的一些性质。其中由遍历定理,从不同的起始点出发,通过大量的随机游走,采集的样本,都会收敛到同一平稳分布。那这就又给了一个采样的思路:在随机变量x的状态空间S上定一个一个满足遍历定理的马尔可夫链X={},使其平稳分布就是抽样的目标分布p(x).然后在这个马尔可夫链上进行随机游走,每个时刻得到一个样本。根据遍历定理,当时间趋于无穷时,样本的分布趋近平稳分布,样本的函数均值趋近于函数的数学期望。所以,当时间足够长时(时刻大于某个正整数m),在之后的时间(时刻小于等于某个正整数n, n > m)里随机游走得到的样本集合{
}就是目标概率分布的抽样的结果,得到的函数均值(遍历均值)就是要计算的数学期望值:
到时刻m为止的时间段称为燃烧期。
综上,如果我们能够找到一个合适的转移核函数(连续函数),或是转移矩阵(离散函数),使得平稳分布就是抽样的目标分布p(x),就可以通过上述方法进行采样。采用这种采样的方法,就叫做马尔可夫链蒙特卡洛方法。
易知,采用马尔可夫链蒙特卡洛方法得到的样本序列,相邻的样本点是相关的,而不是独立的。因此,在需要独立样本的时候,可以在该样本序列中再次进行随机采样,比如每隔一段时间取一次样本,将这样得到的子样本集合作为独立样本集合。