理解Markov平稳条件
看到西瓜书的近似推断的地方,蹦出来一个马尔可夫平稳条件
,
p(xt)T(xt−1|xt)=p(xt−1)T(xt|xt−1)
,看到这着实蒙了一会,之后查找一些资料后,终于搞明白这个公式是怎么来的了。
Markov Chain
马尔可夫链是由一个条件分布表示的
P(Xt+1|Xt)
,这个公式也被称为转移概率。
P(Xt)
表示当前时间X
的概率分布。有
P(Xt+1)=∫P(Xt+1|Xt)P(Xt)dXt
。当
P(Xt+1=a)=P(Xt=a) ∀a∈X
时,我们称为平稳状态。
Marcov平稳条件
为了简单,我们假设X
只有两种取值a,b
,当到达平稳状态时,
[
Pt+1(a),Pt+1(b)
] = [
Pt(a),Pt(b)
].即:
pt(a),pt(b)
*
Pa|aPa|bPb|aPb|b
=
[pt+1(a),pt+1(b)]
pt+1(a)=pt(a)Pa|a+pt(b)Pa|bpt+1(b)=pt(a)Pb|a+pt(a)Pb|b
因为 pt+1(a)=pt(a),pt+1(b)=pt(b) ,所以
p(a)(1−Pa|a)=p(b)Pa|bp(a)Pb|a=p(b)Pa|b
得证。
参考:
马尔可夫链