CRF模型

英文原文:http://blog.echen.me/2012/01/03/introduction-to-conditional-random-fields/
参考文章:http://www.jianshu.com/p/55755fc649b1

对该文章的总结

CRF模型的核心由两部分组成:
  1. 特征函数(制定标注序列的规则)
  2. 标注序列 ( 为问题的解空间)
线性链CRF模型的特征函数:

f(s,i,li,li1)

  1. 输入包含4个参数:s(句子) , i (句子的第i个词), Li(当前标注序列标注句子s第i个词的词性),Li-1(当前标注序列标注句子s第i-1个词的词性)
  2. 输出有两种可能:0(不符合特征)1(符合特征)

  3. 线性链的CRF模型的计算公式如下

    score(l/s)=j=1mi=1nλjfj(s,i,li,li1)

    (实质就是用一个标注序列用在一个句子上的情况下,用所有的特征函数遍历一遍的评分)

CRF模型比HMM的强大之处
  1. HMM是CRF模型的一种形式,非常接近线性链CRF
    HMM的计算公式如下:

    p(l,s)=p(l1)ip(li|li1)p(wi|li)

    其中:p( li | li1 )是转移概率(transition_probability),比如, li1 是介词, li 是名词,此时的p表示介词后面的词是名词的概率。
    p( wi | li )表示发射概率(emission_probability),比如 li 是名词, wi 是单词“ball”,此时的p表示在是名词的状态下,是单词“ball”的概率。

  2. CRF可以自定义特征函数,而不是只是考虑标注序列的前后二元结构,从而可以制定出更加考虑全局性的特征函数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值