英文原文:http://blog.echen.me/2012/01/03/introduction-to-conditional-random-fields/
参考文章:http://www.jianshu.com/p/55755fc649b1
对该文章的总结
CRF模型的核心由两部分组成:
- 特征函数(制定标注序列的规则)
- 标注序列 ( 为问题的解空间)
线性链CRF模型的特征函数:
f(s,i,li,li−1)
- 输入包含4个参数:s(句子) , i (句子的第i个词), Li(当前标注序列标注句子s第i个词的词性),Li-1(当前标注序列标注句子s第i-1个词的词性)
输出有两种可能:0(不符合特征)1(符合特征)
线性链的CRF模型的计算公式如下
score(l/s)=∑j=1m∑i=1nλjfj(s,i,li,li−1)
(实质就是用一个标注序列用在一个句子上的情况下,用所有的特征函数遍历一遍的评分)
CRF模型比HMM的强大之处
HMM是CRF模型的一种形式,非常接近线性链CRF
HMM的计算公式如下:
p(l,s)=p(l1)∏ip(li|li−1)p(wi|li)
其中:p( li | li−1 )是转移概率(transition_probability),比如, li−1 是介词, li 是名词,此时的p表示介词后面的词是名词的概率。
p( wi | li )表示发射概率(emission_probability),比如 li 是名词, wi 是单词“ball”,此时的p表示在是名词的状态下,是单词“ball”的概率。CRF可以自定义特征函数,而不是只是考虑标注序列的前后二元结构,从而可以制定出更加考虑全局性的特征函数