从马尔科夫链的状态转移矩阵的收敛性写起。
矩阵定义:1.元素非负;2.列和为1(或者行和为1)。
如此进行的状态转移才是平稳的,比如100个人在10个城市间迁移,每次迁移完总数还是100个人。
这类矩阵有4个性质:
1.有个特征值为1。这个容易验证,对应特征向量为全1。
2.矩阵的n次方仍然是马尔科夫矩阵。也容易验证和推导。
3.所有特征值的绝对值不大于1。若
λ
\lambda
λ是A的特征值,则
λ
n
\lambda^n
λn是
A
n
A^n
An的特征值,而
A
n
A^n
An仍然是马尔科夫矩阵,
A
n
x
A^nx
Anx不可能无限大。
4.对于任意初始
x
0
x_0
x0,马尔科夫过程
A
n
x
0
A^nx_0
Anx0最终收敛。
证明:假设
A
A
A有n个特征向量
x
1
,
x
2
,
.
.
.
,
x
n
x_1,x_2,...,x_n
x1,x2,...,xn,对应的的特征值为
1
,
λ
2
,
λ
3
,
.
.
.
,
λ
n
1, \lambda_2,\lambda_3,...,\lambda_n
1,λ2,λ3,...,λn.对于任意向量
x
0
x_0
x0总存在常数
c
1
,
c
2
,
.
.
.
,
c
n
c_1,c_2,...,c_n
c1,c2,...,cn使得
x
0
=
c
1
x
1
+
.
.
.
+
c
n
x
n
x_0=c_1x_1+...+c_nx_n
x0=c1x1+...+cnxn,则
A
n
x
0
=
A
n
(
c
1
x
1
+
.
.
.
+
c
n
x
n
)
=
c
1
1
n
x
1
+
.
.
.
c
n
λ
n
x
n
=
c
1
x
1
.
A^nx_0=A^n(c_1x_1+...+c_nx_n)=c_11^nx_1+...c_n\lambda^nx_n=c_1x_1.
Anx0=An(c1x1+...+cnxn)=c11nx1+...cnλnxn=c1x1.收敛,得证.
同时可以知道,对于状态转移矩阵
A
A
A,它的n次幂
A
n
A^n
An在当n大于一定的值的时候也是确定的,此时特征值为1和0.
可以看到,对于不同的初始状态,最终都会收敛,并且所有的结果只差一个常数,如果将结果归一化,便是唯一的
x
1
x_1
x1。这确实是一个很神奇的性质。因为
A
x
1
=
x
1
Ax_1=x_1
Ax1=x1,一般将这里的
x
1
x_1
x1称作对应马尔科夫链的平稳分布。
基于马尔科夫链的采样过程:
1)输入马尔科夫链状态转移矩阵𝑃,设定状态转移次数阈值𝑛1,需要的样本个数𝑛2
2)从任意简单概率分布采样得到初始状态值𝑥0
3)for 𝑡=0 to 𝑛1+𝑛2−1: 从条件概率分布𝑃(𝑥|𝑥𝑡)中采样得到样本𝑥𝑡+1。样本集(𝑥𝑛1,𝑥𝑛1+1,…,𝑥𝑛1+𝑛2−1)即为我们需要的平稳分布对应的样本集。
由平稳分布求
P
P
P:
需要满足
π
P
=
π
\pi P=\pi
πP=π,即𝜋(𝑖)𝑃(𝑖,𝑗)=𝜋(𝑗)𝑃(𝑗,𝑖),但是对一般的马尔科夫矩阵Q不满足细致平稳条件,即𝜋(𝑖)𝑄(𝑖,𝑗)≠𝜋(𝑗)𝑄(𝑗,𝑖)。可以引入额外矩阵使得𝜋(𝑖)𝑄(𝑖,𝑗)𝛼(𝑖,𝑗)=𝜋(𝑗)𝑄(𝑗,𝑖)𝛼(𝑗,𝑖)。𝛼(𝑖,𝑗)我们一般称之为接受率。取值在[0,1]之间,即目标矩阵𝑃可以通过任意一个马尔科夫链状态转移矩阵𝑄以一定的接受率获得,实际应用时便是以一定概率接受或拒绝基于𝑄的状态装换。由于𝛼(𝑖,𝑗)可能很小,导致拒绝率高而使得很多结果通不过而浪费掉了。使𝛼(𝑖,𝑗)=𝑚𝑖𝑛{𝜋(𝑗)𝑄(𝑗,𝑖)/𝜋(𝑖)𝑄(𝑖,𝑗),1}可以有效提升。
MCMC采样
最新推荐文章于 2024-05-08 09:43:22 发布