MCMC采样

从马尔科夫链的状态转移矩阵的收敛性写起。
矩阵定义:1.元素非负;2.列和为1(或者行和为1)。
如此进行的状态转移才是平稳的,比如100个人在10个城市间迁移,每次迁移完总数还是100个人。
这类矩阵有4个性质:
1.有个特征值为1。这个容易验证,对应特征向量为全1。
2.矩阵的n次方仍然是马尔科夫矩阵。也容易验证和推导。
3.所有特征值的绝对值不大于1。若 λ \lambda λ是A的特征值,则 λ n \lambda^n λn A n A^n An的特征值,而 A n A^n An仍然是马尔科夫矩阵, A n x A^nx Anx不可能无限大。
4.对于任意初始 x 0 x_0 x0,马尔科夫过程 A n x 0 A^nx_0 Anx0最终收敛。
证明:假设 A A A有n个特征向量 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn,对应的的特征值为 1 , λ 2 , λ 3 , . . . , λ n 1, \lambda_2,\lambda_3,...,\lambda_n 1,λ2,λ3,...,λn.对于任意向量 x 0 x_0 x0总存在常数 c 1 , c 2 , . . . , c n c_1,c_2,...,c_n c1,c2,...,cn使得 x 0 = c 1 x 1 + . . . + c n x n x_0=c_1x_1+...+c_nx_n x0=c1x1+...+cnxn,则 A n x 0 = A n ( c 1 x 1 + . . . + c n x n ) = c 1 1 n x 1 + . . . c n λ n x n = c 1 x 1 . A^nx_0=A^n(c_1x_1+...+c_nx_n)=c_11^nx_1+...c_n\lambda^nx_n=c_1x_1. Anx0=An(c1x1+...+cnxn)=c11nx1+...cnλnxn=c1x1.收敛,得证.
同时可以知道,对于状态转移矩阵 A A A,它的n次幂 A n A^n An在当n大于一定的值的时候也是确定的,此时特征值为1和0.
可以看到,对于不同的初始状态,最终都会收敛,并且所有的结果只差一个常数,如果将结果归一化,便是唯一的 x 1 x_1 x1。这确实是一个很神奇的性质。因为 A x 1 = x 1 Ax_1=x_1 Ax1=x1,一般将这里的 x 1 x_1 x1称作对应马尔科夫链的平稳分布。
基于马尔科夫链的采样过程:
1)输入马尔科夫链状态转移矩阵𝑃,设定状态转移次数阈值𝑛1,需要的样本个数𝑛2
2)从任意简单概率分布采样得到初始状态值𝑥0
3)for 𝑡=0 to 𝑛1+𝑛2−1: 从条件概率分布𝑃(𝑥|𝑥𝑡)中采样得到样本𝑥𝑡+1。样本集(𝑥𝑛1,𝑥𝑛1+1,…,𝑥𝑛1+𝑛2−1)即为我们需要的平稳分布对应的样本集。
由平稳分布求 P P P:
需要满足 π P = π \pi P=\pi πP=π,即𝜋(𝑖)𝑃(𝑖,𝑗)=𝜋(𝑗)𝑃(𝑗,𝑖),但是对一般的马尔科夫矩阵Q不满足细致平稳条件,即𝜋(𝑖)𝑄(𝑖,𝑗)≠𝜋(𝑗)𝑄(𝑗,𝑖)。可以引入额外矩阵使得𝜋(𝑖)𝑄(𝑖,𝑗)𝛼(𝑖,𝑗)=𝜋(𝑗)𝑄(𝑗,𝑖)𝛼(𝑗,𝑖)。𝛼(𝑖,𝑗)我们一般称之为接受率。取值在[0,1]之间,即目标矩阵𝑃可以通过任意一个马尔科夫链状态转移矩阵𝑄以一定的接受率获得,实际应用时便是以一定概率接受或拒绝基于𝑄的状态装换。由于𝛼(𝑖,𝑗)可能很小,导致拒绝率高而使得很多结果通不过而浪费掉了。使𝛼(𝑖,𝑗)=𝑚𝑖𝑛{𝜋(𝑗)𝑄(𝑗,𝑖)/𝜋(𝑖)𝑄(𝑖,𝑗),1}可以有效提升。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值