统计概率模型-条件随机场

统计概率模型

1、高斯判别分析
2、朴素贝叶斯
3、隐马尔可夫模型
4、最大熵马尔科夫模型
5,条件随机场
6,马尔科夫决策过程

五、条件随机场

​ 条件随机场是一个概率图模型,深入图模型的话实在有太多东西。这里,我们接着隐马尔科夫模型和最大熵马尔科夫模型基础理解条件随机场。在序列标注问题上,条件随机场与两者之间的差异

1)隐马尔科夫模型是一个生成模型,其假设当前时刻状态只与上一状态有关,而当前的观测值只与当前的状态有关,所以独立性假设非常强。

2)最大熵马尔科夫模型则通过特征模板的定义克服了独立性假设问题。基于熵原理,在满足所有条件经验期望的条件下,熵最大的为最好的模型,也就导出了对数线性模型,是一个标准的判别模型。

3)条件随机场同最大熵马尔科夫模型非常一致,也是一个基于特征模板的判别模型。然而在序列标注问题上,最大熵马尔科夫模型将每个时刻看作是一个分类问题,每时刻独立归一化,这就导致标注偏置问题,条件随机场则归一化作用于整个序列。

结合最大熵模型,模型输出条件概率 P(Y|X) P ( Y | X ) ,假设所有的特征模板为 fi(x,y) f i ( x , y ) ,(其中一些书中分为转移特征和发射特征)。最大化条件概率为:

Pw(y|x)=1zw(x)(expiwifi(x,y))zw(x)=yexp(iwifi(x,y)) P w ( y | x ) = 1 z w ( x ) ( e x p ∑ i w i f i ( x , y ) ) z w ( x ) = ∑ y e x p ( ∑ i w i f i ( x , y ) )

考虑整个序列的条件概率 P(Y|X) P ( Y | X ) ,条件随机场的目标函数是最大化 P(Y|X) P ( Y | X )
Pw(Y|X)=1zw(x)(expit=1Twifi(x,y))zw(X)=yexp(it=1Twifi(x,y)) P w ( Y | X ) = 1 z w ( x ) ( e x p ∑ i ∑ t = 1 T w i f i ( x , y ) ) z w ( X ) = ∑ y e x p ( ∑ i ∑ t = 1 T w i f i ( x , y ) )

对于参数的学习,同样可以采用最大熵模型使用的优化算法,比如梯度下降的方法。

状态预测问题就是一个最大化序列概率获得状态序列:

y=argmaxyPw(y|x)=argmaxyexp(iwifi(x,y))zw(x)=argmaxy(iwifi(x,y)) y ∗ = a r g max y P w ( y | x ) = a r g max y e x p ( ∑ i w i f i ( x , y ) ) z w ( x ) = a r g max y ( ∑ i w i f i ( x , y ) )

其中归一化因子忽略,分子的指数形式单调递增也忽略。所以整个序列的状态等价于在最优的状态序列下特征模板与特征模板权重乘积和最大。就此,条件随机场就变成了一个特征模板定义的问题了,特征模板直接决定条件随机场的性能。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值