#1 应用实例
在给照片分类时,考虑相邻照片的标签信息
#2 定义特征函数函数集合,给标注序列打分。
特征函数:
句子s(就是我们要标注词性的句子)
i,用来表示句子s中第i个单词
l_i,表示要评分的标注序列给第i个单词标注的词性
l_i-1,表示要评分的标注序列给第i-1个单词标注的词性
它的输出值是0或者1,0表示要评分的标注序列不符合这个特征,1表示要评分的标注序列符合这个特征。
(线性链CRF:特征函数仅根据当前单词标签和前一个单词标签评判)
从特征函数到概率
** 指数化和标准化 **
特征函数例子:
当l_i-1是介词,l_i是名词时,f3 = 1,其他情况f3=0。λ3也应当是正的,并且λ3越大,说明我们越认为介词后面应当跟一个名词。
其他补充
1 HMM
p(l_i|l_i-1)是转移概率,比如,l_i-1是介词,l_i是名词,此时的p表示介词后面的词是名词的概率。p(w_i|l_i)表示发射概率(emission probability),比如l_i是名词,w_i是单词“ball”,此时的p表示在是名词的状态下,是单词“ball”的概率。
* 每一个HMM模型都等价于某个CRF*
** CRF优点**
1 丰富的特征函数 2 使用任意权重
作者:milter链接:https://www.jianshu.com/p/55755fc649b1来源:简书著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。