第十一章 条件随机场

条件随机场(CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔科夫随机场。
定义1.1 (条件随机场) X X Y是随机变量, P(Y|X) P ( Y | X ) 是在给定 X X 的条件下Y的条件概率分布。若随机变量 Y Y 构成一个由无向图G=(V,E)表示的马尔科夫随机场,即

P(Yv|X,Yw,wv)=P(Yv|X,Yw,wv)(1) (1) P ( Y v | X , Y w , w ≠ v ) = P ( Y v | X , Y w , w ∼ v )
对任意结点 v v 成立,则称条件概率分布P(Y|X)为条件随机场。式中 wv w ∼ v 表示在图 G=(V,E) G = ( V , E ) 中与结点 v v 有边连接的所有结点w wv w ≠ v 表示结点 v v 以外的所有结点,Yv, Yu Y u , Yw Y w 为节点 v,u,w v , u , w 对应的随机变量。
定义1.2 (线性链条件随机场) X=(X1,X2,...,Xn) X = ( X 1 , X 2 , . . . , X n ) , Y=(Y1,Y2,...,Yn) Y = ( Y 1 , Y 2 , . . . , Y n ) 均为线性链表示的随机变量序列,若在给定的随机变量序列 X X 的条件下,随机变量序列Y的条件概率分布 P(Y|X) P ( Y | X ) 构成条件随机场,即满足马尔科夫性
P(Yi|X,Y1,...,Yi1,Yi+1,...,Yn)=P(Yi|X,Yi1,Yi+1) P ( Y i | X , Y 1 , . . . , Y i − 1 , Y i + 1 , . . . , Y n ) = P ( Y i | X , Y i − 1 , Y i + 1 )
i=1,2,...,n(i=1n) i = 1 , 2 , . . . , n ( 在 i = 1 和 n 时 只 考 虑 单 边 )
则称 P(Y|X) P ( Y | X ) 为线性链条件随机场。在标注问题中, X X 表示输入观测序列,Y表示对于的输出序列或状态序列。
定理1.1(线性链条件随机场的参数化形式) P(Y|X) P ( Y | X ) 为线性链条件随机场,则在随机变量 X X 取值为x的条件下,随机变量 Y Y 取值为y的条件概率具有如下形式:
P(y|x)=1Z(x)exp(i,kλktk(yi1,yi,x,i)+i,lμlsl(yi,x,i)) P ( y | x ) = 1 Z ( x ) e x p ( ∑ i , k λ k t k ( y i − 1 , y i , x , i ) + ∑ i , l μ l s l ( y i , x , i ) )
其中,
Z(x)=yexp(i,kλktk(yi1,yi,x,i)+i,lμlsl(yi,x,i)) Z ( x ) = ∑ y exp ⁡ ( ∑ i , k λ k t k ( y i − 1 , y i , x , i ) + ∑ i , l μ l s l ( y i , x , i ) )
式中, tk t k sl s l 是特征函数, λk λ k μl μ l 是对应的权值。 Z(x) Z ( x ) 是规范化因子,求和是在所有可能的输出序列上进行的。

条件随机场的学习算法

算法1.1(条件随机场模型学习的改进的迭代尺度法)
输入:特征函数 t1,t2,...,tK1 t 1 , t 2 , . . . , t K 1 , s1,s2,...,sK2 s 1 , s 2 , . . . , s K 2 ;经验分布 P~(x,y) P ~ ( x , y ) ;
输出:参数估计值 w^ w ^ ;模型 Pw^ P w ^ .
(1)对所有 k{1,2,...,K} k ∈ { 1 , 2 , . . . , K } ,取初值 wk=0 w k = 0
(2)对每一 k{1,2,...,K} k ∈ { 1 , 2 , . . . , K }
(a)当 k=1,2,...,K1 k = 1 , 2 , . . . , K 1 时,令 δK1+l δ K 1 + l 是方程

x,yP~(x)P(y|x)i=1nsl(yi,x,i)exp(δK1+lT(x,y))=EP~[sl] ∑ x , y P ~ ( x ) P ( y | x ) ∑ i = 1 n s l ( y i , x , i ) e x p ( δ K 1 + l T ( x , y ) ) = E P ~ [ s l ]
的解,式中
T(x,y)=kfk(y,x)=k=1Ki=1n+1fk(yi1,yi,x,i) T ( x , y ) = ∑ k f k ( y , x ) = ∑ k = 1 K ∑ i = 1 n + 1 f k ( y i − 1 , y i , x , i )

(b)更新 wk w k 的值: wkwk+δk w k ← w k + δ k
(3)如果不是所有 wk w k 都收敛,重复步骤(2)。
算法1.2(条件随机场模型学习的BFGS法)
输入:特征函数 f1,f2,...,fn; f 1 , f 2 , . . . , f n ; 经验分布 P~(X,Y) P ~ ( X , Y ) ;
输出:最优参数值 w^ w ^ ;最优模型 Pw^(y|x) P w ^ ( y | x )
(1)选定初始点 w(0) w ( 0 ) ,取 B0 B 0 为正定对称矩阵,置 k=0 k = 0
(2)计算 gk=g(w(k)) g k = g ( w ( k ) ) ,若 gk=0 g k = 0 ,则停止计算;否则转(3)
(3)由 Bkpk=gk B k p k = − g k 求出 pk p k
(4)一维搜索:求 λk λ k 使得
f(w(k)+λkpk)=minλ0f(w(k)+λpk) f ( w ( k ) + λ k p k ) = min λ ≥ 0 f ( w ( k ) + λ p k )

(5)置 w(k+1)=w(k)+λkpk w ( k + 1 ) = w ( k ) + λ k p k
(6)计算 gk+1=g(w(k+1)) g k + 1 = g ( w ( k + 1 ) ) ,若 gk=0 g k = 0 ,则停止计算;否则按下式求出 Bk+1 B k + 1
Bk+1=Bk+ykyTkyTkδkBkδkδTkBkδTkBkδk B k + 1 = B k + y k y k T y k T δ k − B k δ k δ k T B k δ k T B k δ k
其中,
yk=gk+1gk,δk=w(k+1)w(k) y k = g k + 1 − g k , δ k = w ( k + 1 ) − w ( k )

(7)置 k=k+1 k = k + 1 ,转(3)。
算法1.3(条件随机场预测的维特比算法)
输入:模型特征向量 F(y,x) F ( y , x ) 和权值向量 w w ,观测序列x=(x1,x2,...,xn)
输出:最优路径 y=(y1,y2,...,yn) y ∗ = ( y 1 ∗ , y 2 ∗ , . . . , y n ∗ )
(1)初始化
δ1(j)=wF1(y0=start,y1=j,x),j=1,2,...,m δ 1 ( j ) = w ⋅ F 1 ( y 0 = s t a r t , y 1 = j , x ) , j = 1 , 2 , . . . , m

(2)递推。对 i=2,3,...,n i = 2 , 3 , . . . , n
δi(j)=max1jm{δi1(j)+wFi(yi1=j,yi=l,x)},l=1,2,...,m δ i ( j ) = max 1 ≤ j ≤ m { δ i − 1 ( j ) + w ⋅ F i ( y i − 1 = j , y i = l , x ) } , l = 1 , 2 , . . . , m

Ψi(j)=argmax1jm{δi1(j)+wFi(yi1=j,yi=l,x)},l=1,2,...,m Ψ i ( j ) = a r g max 1 ≤ j ≤ m { δ i − 1 ( j ) + w ⋅ F i ( y i − 1 = j , y i = l , x ) } , l = 1 , 2 , . . . , m

(3)终止
maxy(wF(y,x))=max1jmδn(j) max y ( w ⋅ F ( y , x ) ) = max 1 ≤ j ≤ m δ n ( j )
yn=argmax1jmδn(j) y n ∗ = a r g max 1 ≤ j ≤ m δ n ( j )

(4)返回路径
yi=Ψi+1(yi+1),i=n1,n2,...,1 y i ∗ = Ψ i + 1 ( y i + 1 ∗ ) , i = n − 1 , n − 2 , . . . , 1

求得最优路径 y=(y1,y2,...,yn) y ∗ = ( y 1 ∗ , y 2 ∗ , . . . , y n ∗ )

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值