MCMC (7) --- Markov Chain Monte Carlo (2) --- MH (1)

上一节已经讲到,如果能够构建一个马尔可夫链,让这个马尔可夫链的平稳分布为抽样的目标分布p(x)。在这个马尔可夫链上随机游走就可以进行采样。那么问题来了,如何构建这样的马尔可夫链那?一个方法是定义特殊的转移核函数或者转移矩阵,构建可逆马尔可夫链,常用的马尔可夫链蒙特卡洛方法有Metropolis-Hastings算法,吉布斯抽样,本节终点介绍Metropolis-Hastings算法。

Metropolis-Hastings算法采用的特殊转移核为p(x,x^{'})的马尔可夫链:

p(x,x^{'}) = q(x,x^{'})\alpha (x,x^{'})

其中q(x,x^{'})称为建议分布(proposal distribution), \alpha (x,x^{'})称为接受分布(acceptance distribution)。其中建议分布q(x,x^{'})是另一个马尔可夫链的转移核,并且q(x,x^{'})是不可约的,同时是一个容易抽样的分布。抽样分布 \alpha (x,x^{'})定义为

\alpha (x,x^{'}) = min{1,\frac{p(x^{'})q(x^{'},x)}{p(x)q(x,x^{'})}}

通过带入,可以得到p(x,x^{'})

p(x,x^{'}) = \left\{\begin{matrix} q(x,x^{'}) , p(x^{'})q(x^{'},x) \geqslant p(x)q(x,x^{'}) \\ q(x,x^{'})\frac{p(x^{'})}{p(x)} , p(x^{'})q(x^{'},x) < p(x)q(x,x^{'}) \end{matrix}\right.

 转移核为p(x,x^{'})的马尔可夫链上的随机游走以以下方式进行。如果在时刻(t-1)处于状态x,即x_{t-1} = x,则先按建议分布q(x,x^{'})抽样产生一个候选状态x^{'},然后按照接收分布 \alpha (x,x^{'})抽样决定是否接受状态x^{'}。以概率\alpha (x,x^{'})接受x^{'},而以概率1-\alpha (x,x^{'})决绝x^{'},决定时刻t仍停留在状态x。具体地,从区间(0,1)上均匀分布中抽取一个随机数u,决定时刻t的状态。

x_{t}=\left\{\begin{matrix} x^{'} , u \leq \alpha (x,x^{'}) \\ x , u > \alpha (x,x^{'}) \end{matrix}\right.

好了,构建的p(x,x^{'})看似一切都很完美,但是这里忽略了一个大前提,就是这样构建的马尔可夫链是否最后能够达到平稳分布?

p(x)p(x,x^{'}) = p(x)q(x,x^{'})min\begin{Bmatrix} 1,\frac{p(x^{'})q(x^{'},x)}{p(x)q(x,x^{'})} \end{Bmatrix}

                     = min{p(x)q(x,x^{'}), p(x^{'}q(x,x^{'}))}

                     = p(x^{'})q(x^{'},x)min{\frac{p(x)q(x,x^{'})}{p(x^{'})q(x^{'},x)}}

                     = p(x^{'})p(x^{'},x)

根据平稳分布的定义,p(x)是马尔可夫链的平稳分布。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值