1.条件随机场概念
CRF,Conditional Random Field,是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模式,其特点是假设输出随机变量构成马尔可夫随机场。
条件随机场用于不同的预测问题。CRF条件随机场是给定随机变量X时,随机变量Y的马尔可夫随机场。
有一种条件随机场是线性链条件随机场(Linear Chain Conditional Random Field)。线性链条件随机场可以用于标注等问题。then,在条件概率P(Y|X)中,Y是输出变量,表示标记序列,X是输入变量,表示需要标注的观测序列。也把标记序列称为状态序列(见隐马尔可夫模型)。
2.条件随机场的参数化形式
现在有一标注问题:输入观测序列为X=(X1,X2,X3),输出标记序列为Y=(Y1,Y2,Y3),Y1,Y2,Y3取值于{1,2}.
假设特征t<k>,s<l>的对应的权值为λ<k>,μ<l>,公式如下所示:
这里只注明特征取值为1的条件,取值为0的条件省略,如下:
<