第14章 概率模型--条件随机场

条件随机场(Conditional Random Field,简称CRF)是一种判别式无向图模型。14.1节提到过,生成式模型是直接对联合分布进行建模,而判别式模型则是对条件分布进行建模。前面介绍的隐马尔可夫模型和马尔可夫随机场都是生成式模型,而条件随机场则是判别式模型。
条件随机场试图对多个变量在给定观测值后的条件概率进行建模。具体来说,若令 x={x1,x2,...,xn} 为观察序列, y={y1,y2,...,yn} 为与之对应的标记序列,则条件随机场的目标是构建条件概率模型 P(y|x) 。需要注意的是,标记变量 y 可以是结构型变量,即其分量之间具有某种相关性。例如在自然语言处理的词性标注任务中,如图5(a)所示;在语法分析任务中,输出标记则是语法数,具有树形结构,如图(b)所示。
图5 自然语言处理中的词性标注和语法分析任务

这里写图片描述

G=V,E表示节点与标记变量 y 中元素一一对应的无向图,yv表示与节点 v 对应的标记变量,n(v)表示节点 v 的邻接节点,若图G的每个变量 yv 都满足马尔可夫性,即

P(yv|x,yV{v})=P(yv|x,yn(v))10

(y,x) 构成一个条件随机场。
理论上来说,图 G 可具有任意结构,只要能表示标记变量之间的条件独立性关系即可。但在现实应用中,尤其是对标记序列建模时,最常用的仍是图6所示的链式结构,即“链式条件随机场”(chain-structured CRF)。下面我们主要讨论这种条件随机场。
图6 链式条件随机场的图结构

这里写图片描述

与马尔可夫随机场定义联合概率的方式类似,条件随机场使用势函数和图结构上的团来定义条件概率P(y|x)。给定观测序列 x ,图6所示的链式条件随机场主要包含两种关于标记变量的团,即单个标记变量{yi}以及相邻的标记变量 {yi1,yi} 。选择合适的势函数,即可得到形如式(2)的条件概率定义。在条件随机场中,通过选用指数势函数并引入特征函数(feature function),条件概率被定义为

P(y|x)=1Zexp(ji=1n1λjtj(yi+1,yi,x,i))+ki=1nμksk(yi,x,i))11

其中 ti(yi+1,yi,x,i) 是定义在观测序列的两个相邻标记位置上的转移特征函数(transition feature function),用于刻画相邻标记变量之间的相关关系以及观测序列对它们的影响, sk(yi,x,i) 是定义在观测序列的两个相邻标记位置上的转移特征函数(transition feature function),用于刻画观测序列对标记变量的影响, λj μk 为参数, Z 为规范化因子,用于确保式(11)的正确定义的概率。
显然,要使用条件随机场,还需定义合适的特征函数。特征函数通常是实值函数,以刻画数据的一些很可能成立或期望成立的经验特性。以图5(a)的词性标注任务为例,若采用转移特征函数
ti(yi+1,yi,x,i)={1,if yi+1=[P],yi=[V]andxi="knock"0,otherwise

则表示第 i 个观测值xi为单词“knock”时,相应的标记 yi yi+1 很可能分别为 [V] [P] 。若采用状态特征函数
sk(yi,x,i)={1,if yi=[V]andxi="knock";0,otherwise,

则表示观测值 xi 为单词“knock”时,它所对应的标记很可能为 [V]
对比式(11)和(2)可看出,条件随机场和马尔可夫随机场均使用团上的势函数定义概率,两者在形式上没有显著区别;但条件随机场处理的是条件概率,而马尔可夫随机场处理的是联合概率。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值