相信学过随机过程的同学们,一定会知道马尔科夫链。这是一种利用统计方法和模型对大自然中的事物进行处理和预测的算法,例如对股票市场的走向进行判断,对话预测,诗词创作等等。既然马尔科夫链的用处这么广泛,那我们有理由好好认识它一下。
马尔科夫链的图例
其实马尔科夫链可以看作是是一种较为简单的概率图模型,每个节点以单向或双向的连接方式嵌入到同一图空间内。
我们来看一条比较简单的例子。
其中每个节点代表的是要分析的随机变量,节点与节点之间的箭头表示了随机变量之间的转换关系。
马尔可夫链的核心有三要素:状态空间、无记忆性、转移矩阵。
状态空间即每个节点的状态。从图中我们不难看出,马尔科夫链是状态空间中一个状态到另一个状态转换的随机过程。
无记忆性体现在未来的状态分布只取决于现在,与过去无关,如公式中所表达的那样:
P(
s
t
∣
s
t
−
1
,
s
t
−
2
,
.
.
.
,
s
1
s_t|s_{t-1},s_{t-2},...,s_1
st∣st−1,st−2,...,s1)=P(
s
t
∣
s
t
−
1
s_t|s_{t-1}
st∣st−1)
在马尔可夫链的每一步,系统根据概率分布(即转移方程),可以从一个状态转换到另一种状态,也可以保持不变。转移方程中包含了不同状态之间的映射关系,这种映射关系通常表现为概率形式。
从图片直观了解马尔可夫链之后,如果想深究其原理以及应用它,还需要借助马尔可夫链的数学表达形式。
马尔可夫链的数学表达形式
状态向量
X ( n ) = ( X k ( 1 ) , X k ( 2 ) , X k ( 3 ) , . . . , X k ( n ) ) X^{(n)}=(X^{(1)}_k, X^{(2)}_k,X^{(3)}_k,...,X^{(n)}_k) X(n)=(Xk(1),Xk(2),Xk(3),...,Xk(n))
马尔科夫链的可能状态有k个,状态向量中每个元素为一种可能的状态,元素的值都为概率,即当前条件下下转换为该状态的可能性,因为状态向量囊括了所有可能性,所以各元素之和为1.
转移矩阵
p
=
(
p
11
p
21
.
.
.
p
k
1
p
12
p
22
.
.
.
p
k
2
⋮
⋮
⋮
p
1
k
p
2
k
.
.
.
p
k
k
)
\begin{gathered} \quad p=\begin{pmatrix} p_{11} & p_{21} & ...& p_{k1}\\ p_{12} & p_{22} & ...& p_{k2}\\ ⋮ & ⋮ & & ⋮\\ p_{1k} & p_{2k} & ...& p_{kk}\\ \end{pmatrix} \quad \end{gathered}
p=⎝⎜⎜⎜⎛p11p12⋮p1kp21p22⋮p2k.........pk1pk2⋮pkk⎠⎟⎟⎟⎞
其中,
p
i
j
p_{ij}
pij为从状态i转换为状态j的概率,那么根据矩阵乘法和马尔可夫链的演变规律,我们可以得到:
X
(
n
+
1
)
X^{(n+1)}
X(n+1)=
P
P
P
X
(
n
)
X^{(n)}
X(n)
因此根据马尔科夫链的链式传导方式:
X
(
n
+
1
)
X^{(n+1)}
X(n+1)=
P
n
P^n
Pn
X
(
0
)
X^{(0)}
X(0)
由于某一时刻状态转移的情况只依赖前一个状态,那么只要求出系统中任意两个状态之间的转移概率矩阵,这个马尔科夫链的模型就确定了。
马尔科夫链的稳态分布
当观测次数足够多的时候,有些马尔科夫链会出现趋稳的现象,我们称之为马尔科夫的稳态现象,稳态现象时的状态为马尔可夫链的稳态分布。但不是所有的马尔科夫链都有稳态分布,需要满足以下几个条件:
- 常返性。通常表现为回路的形式
- 非周期性
- 状态之间两两连通