条件随机场(conditional random fields, CRFs)由J. Lafferty等人(2001)提出,近几年来在自然语言处理和图像处理等领域中得到了广泛的应用。
CRF是用来标注和划分序列结构数据的概率化结构模型。言下之意,就是对于给定的输出标识序列Y和观测序列X,条件随机场通过定义条件概率P(Y|X),而不是联合概率分布P(X,Y)来描述模型。 CRF也可以看作一个无向图模型或者马尔可夫随机场(Markov random field)。
定义6-5(条件随机场) 设G=(V,E)为一个无向图,V为结点集合,E为无向边的集合。Y={Yv|v∈V},即V中的每个结点对应于一个随机变量Yv,其取值范围为可能的标记集合{y}。如果以观察序列X为条件,每一个随机变量Yv都满足以下马尔可夫特性:
其中,w~v表示两个结点在图G中是邻近结点。那么,(X,Y)为一个条件随机场。
理论上,只要在标记序列中描述了一定的条件独立性,G的图结构可以是任意的。对序列进行建模可以形成最简单、最普通的链式结构(chai