概率无向图模型,又称为马尔科夫随机场,是一个可以由无向图表示的联合概率分布。如果联合概率分布P(Y)满足成对、局部或全局马尔科夫性,就称此联合概率分布为概率无向图模型,或马尔科夫条件随机场。
条件随机场是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出变量构成马尔科夫随机场。线性链条件随机场是无向图、判别模型。 通过因子分解,条件随机场的条件概率分布表示为其最大团中随机变量的函数的乘积形式,函数一般由两种特征组成,一种是转移特征,另一种为状态特征。
1 马尔科夫随机场
z = ∑ x ∏ i = 1 K φ i ( x c i ) z=\sum_x\prod_{i=1}^K\varphi_i(x_{c_i}) z=x∑i=1∏Kφi(xci)
2 线性链条件随机场
- 概率密度函数参数形式如下:
p ( Y ∣ X ) = 1 z e x p ∑ i = 1 K F i ( x c i ) ( 线 性 链 的 条 件 随 机 场 有 n − 1 个 最 大 团 , n 为 节 点 个 数 ) = 1 z e x p ∑ t = 1 T F t ( y t − 1 , y t , x 1 : T ) ( 假 设 存 在 一 个 y 0 , 所 以 为 T 个 最 大 团 ) = 1 z e x p ∑ t = 1 T F ( y t − 1 , y t , x 1 : T ) ( 将 T 个 F 函 数 合 并 为 一 个 F ) = 1 z e x p ∑ t = 1 T [ ∑ k = 1 K λ k f k ( y t − 1 , y t , x 1 : T ) + ∑ l = 1 L η l g l ( y t , x 1 : T ) ] ( λ k 和 η l 是 参 数 需 要 学 习 , f k 和 g l 是 特 征 函 数 , 一 般 为 指 示 函 数 ) p(Y|X)=\frac{1}{z}exp\sum_{i=1}^{K}F_i(x_{c_i})(线性链的条件随机场有n-1个最大团,n为节点个数)\\ =\frac{1}{z}exp\sum_{t=1}^{T}F_t(y_{t-1},y_t,x_{1:T})(假设存在一个y_0,所以为T个最大团)\\ =\frac{1}{z}exp\sum_{t=1}^{T}F(y_{t-1},y_t,x_{1:T})(将T个F函数合并为一个F)\\ =\frac{1}{z}exp\sum_{t=1}^{T}[\sum_{k=1}^{K}\lambda_kf_k(y_{t-1},y_t,x_{1:T})+\sum_{l=1}^{L}\eta_lg_l(y_t,x_{1:T})](\lambda_k和\eta_l是参数需要学习,f_k和g_l是特征函数,一般为指示函数) p(Y∣X)=z1expi=1∑KFi(xci)(线性链的条件随机场有n−1个最大团,n为节点个数)=z1expt=1∑TFt(yt−1,yt,x1:T)(假设存在一个y0,所以为T个最大团)=z1expt=1∑TF(yt−1,yt,x1:T)(将T个F函数合并为一个F)=z1expt=1∑T[k=1∑Kλkfk(yt−1,yt,x1:T)+l=1∑Lηlgl(yt,x1:T)](λk和ηl是参数需要学习,fk和gl是特征函数,一般为指示函数)
注:K和L是提前确定的 - 概率密度函数向量形式如下:
令 y = ( y 1 y 2 ⋅ ⋅ y T ) x = ( x 1 x 2 ⋅ ⋅ x T ) λ = ( λ 1 λ 2 ⋅ ⋅ λ K ) η = ( η 1 η 2 ⋅ ⋅ η L ) f = ( f 1 f 2 ⋅ ⋅ f K ) g = ( g 1 g 2 ⋅ ⋅ g L ) y=\begin{pmatrix} y_1 \\ y_2 \\ \cdot \\ \cdot \\ y_T \end{pmatrix} \ x=\begin{pmatrix} x_1 \\ x_2 \\ \cdot \\ \cdot \\ x_T \end{pmatrix} \ \lambda=\begin{pmatrix} \lambda_1 \\ \lambda_2 \\ \cdot \\ \cdot \\ \lambda_K \end{pmatrix} \ \eta=\begin{pmatrix} \eta_1 \\ \eta_2 \\ \cdot \\ \cdot \\ \eta_L \end{pmatrix} \ f=\begin{pmatrix} f_1 \\ f_2 \\ \cdot \\ \cdot \\ f_K \end{pmatrix} \ g=\begin{pmatrix} g_1 \\ g_2 \\ \cdot \\ \cdot \\ g_L \end{pmatrix} y=⎝⎜⎜⎜⎜⎛y1y2⋅⋅yT⎠⎟⎟⎟⎟⎞ x=⎝⎜⎜⎜⎜⎛x1x2⋅