上一节已经讲到,如果能够构建一个马尔可夫链,让这个马尔可夫链的平稳分布为抽样的目标分布p(x)。在这个马尔可夫链上随机游走就可以进行采样。那么问题来了,如何构建这样的马尔可夫链那?一个方法是定义特殊的转移核函数或者转移矩阵,构建可逆马尔可夫链,常用的马尔可夫链蒙特卡洛方法有Metropolis-Hastings算法,吉布斯抽样,本节终点介绍Metropolis-Hastings算法。
Metropolis-Hastings算法采用的特殊转移核为的马尔可夫链:
其中称为建议分布(proposal distribution),
称为接受分布(acceptance distribution)。其中建议分布
是另一个马尔可夫链的转移核,并且
是不可约的,同时是一个容易抽样的分布。抽样分布
定义为
{
}
通过带入,可以得到
转移核为的马尔可夫链上的随机游走以以下方式进行。如果在时刻(t-1)处于状态x,即
,则先按建议分布
抽样产生一个候选状态
,然后按照接收分布
抽样决定是否接受状态
。以概率
接受
,而以概率1-
决绝
,决定时刻t仍停留在状态x。具体地,从区间(0,1)上均匀分布中抽取一个随机数u,决定时刻t的状态。
好了,构建的看似一切都很完美,但是这里忽略了一个大前提,就是这样构建的马尔可夫链是否最后能够达到平稳分布?
=
= min{}
= {
}
=
根据平稳分布的定义,p(x)是马尔可夫链的平稳分布。