条件随机场模型是Lafferty于2001年,在最大熵模型和隐马尔科夫模型的基础上,提出的一种判别式概率无向图学习模型,是一种用于标注和切分有序数据的条件概率模型;
条件随机场模型作为一个整句联合标定的判别式概率模型,同时具有很强的特征融入能力,是目前解决自然语言序列标注问题最好的统计模型之一。条件随机场的缺点是训练的时间比较长。
条件随机场定义
设G=(V,E)是一个无向图,Y=(Yv),,Y表示图中顶点的结合。如果在观察变量X的条件下,在图G中随机变量Yv服从马尔科夫属性,即:表示在图G中,v,w是邻居,那么(X,Y)就表示一个条件随机场。
即它是在给定需要标记的观察序列 X的条件下计算整个标记序列 Y的联合概率分布,而不是在给定当前状态条件下定义下一个状态的分布。公式如下所示:
HMM.vs MEMM .vs CRF
隐马尔可夫模型中存在两个假设:输出独立性假设和马尔可夫性假设。其中