提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
一、预备知识
- 用一个无向图来表示一个联合概率分布—概率无向图模型
定义:设有联合概率分布P(Y),由无向图 G=(V,E) 表示,节点表示随机变量,边表示随机变量之间的依赖关系。如果联合概率分布P(Y)满足成对,局部或全局马尔可夫性,就称此联合概率分布为概率无向图模型,或马尔科夫随机场。
成对,局部或全局马尔可夫性是啥?统计学方法P192自取
- 最大团
二、条件随机场
定义:设
X
,
Y
X,Y
X,Y是随机变量,
P
(
Y
∣
X
)
P(Y|X)
P(Y∣X)是条件概率分布。若随机变量Y构成一个由无向图
G
=
(
V
,
E
)
G=(V,E)
G=(V,E) 表示的马尔可夫随机场,即
P
(
Y
v
∣
X
,
Y
w
,
w
≠
v
)
=
P
(
Y
v
∣
X
,
Y
w
,
w
∼
v
)
P(Y_v|X,Y_w, w \neq v)=P(Y_v|X,Y_w,w\sim v)
P(Yv∣X,Yw,w=v)=P(Yv∣X,Yw,w∼v)
对任意节点
v
v
v成立则称条件概率分布
P
(
Y
∣
X
)
P(Y|X)
P(Y∣X)为条件随机场。
w
∼
v
w\sim v
w∼v 表示图G中与
v
v
v有边相连接的所有结点,
w
≠
v
w \neq v
w=v 表示结点
v
v
v以外的所有结点
不明白看图,用线性链条件随机场举个例子,
也就是说结点
v
v
v的随机变量
Y
v
Y_v
Yv的概率分布,只与他左右的两个节点有关,与其他不相连结点无关:
P
(
Y
i
∣
X
,
Y
1
,
…
,
Y
i
−
1
,
Y
i
+
1
,
…
,
Y
n
)
=
P
(
Y
i
∣
X
,
Y
i
−
1
,
Y
i
+
1
)
P(Y_i|X,Y_1,\dots,Y_{i-1},Y_{i+1} ,\dots,Y_n)=P(Y_i|X,Y_{i-1},Y_{i+1})
P(Yi∣X,Y1,…,Yi−1,Yi+1,…,Yn)=P(Yi∣X,Yi−1,Yi+1)
1.参数化
先从概率无向图的参数化讲起
(Hammersley-Clifford)概率无向图模型的联合概率分布
P
(
Y
)
P(Y)
P(Y)可以表示为如下形式:
P
(
Y
)
=
1
Z
∏
C
Ψ
C
(
Y
C
)
P(Y)=\frac{1}{Z}\prod_{C}\Psi_C(Y_C)
P(Y)=Z1C∏ΨC(YC)
Z
=
∑
Y
∏
C
Ψ
C
(
Y
C
)
Z=\sum_Y \prod_C \Psi_C(Y_C)
Z=Y∑C∏ΨC(YC)
其中
C
C
C 是无向图的最大团,
Y
C
Y_C
YC 是
C
C
C的结点对用的随机变量,
Ψ
C
(
Y
C
)
\Psi_C(Y_C)
ΨC(YC)是
C
C
C 上定义的严格正函数,乘积实在无向图的所有最大团上进行的。
2.CRF参数化
其中 Z ( x ) = ∑ y e x p ( ∑ i , k λ k t k ( y i − 1 , y i , x , i ) + ∑ i , l μ l s l ( y i , x , i ) ) Z(x)=\sum_yexp(\sum_{i,k} \lambda_kt_k(y_{i-1},y_i,x,i)+\sum_{i,l} \mu_ls_l(y_i,x,i)) Z(x)=y∑exp(i,k∑λktk(yi−1,yi,x,i)+i,l∑μlsl(yi,x,i))