条件随机场:Conditionl Random Field

CRF

条件随机场是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。条件随机场可以用于不同的预测问题。


概率无向图模型

定义

概率无向图模型又称为马尔可夫随机场(Markov Random Field),是一个可以由无向图表示的联合概率分布。

图一般记作 G=(V,E) ,其中 V 表示节点,E表示边。概率图模型是由图表示的概率分布,设有联合概率分布 P(Y),YY 是一组随机变量,由无向图 G=(V,E) 表示概率分布 P(Y) ,在图中节点 vV 表示一个随机变量 Yv ,边 eE 表示随机变量之间的概率依赖关系。

给定一个联合概率分布 P(Y) 和其所对应的无向图 G 。那么其具有的性质有:

  1. 成对马尔可夫性: 在无向图中,任意一对随机变量在其余随机变量下条件独立。即:P(Yu,YvYo)=P(YvYo)P(YuYo)

    • 局部马尔可夫性:在无向图中,一个点与其非邻接结点所对应的随机变量(组)在邻接结点对应的随机变量(组)下条件独立,即: P(Yo,YvYw)=P(YoYw)P(YvYw)
    • 全局马尔可夫性:无向图中的被一个结点集合 C 分为其他两部分A,B,那么在结点集合 C 对应的随机变量组的条件下,A,B对应的随机变量组条件独立。即: P(YA,YBYC)=P(YAYC)P(YBYC)

      定义(概率无向图模型) 设有联合概率分布 P(Y) ,由无向图 G=(V,E) 表示,在图 G 中节点表示随机变量,边表示随机变量之间的依赖关系。如果联合概率分布P(Y)满足成对、局部或全局马尔可夫性,则称次联合概率分布为概率无向图模型或者马尔可夫随机场。

    • 因子分解

      定义 (团、最大团) 无向图 G 中任何两个结点均有边连接的结点子集称为团(clique)。若C是无向图 G 的一个团,并且不能再加进行任何一个G的结点使其成为一个更大的团,则称之为最大团(maximal clique)。

      将概率无向图模型的联合概率分布表示为其最大团上的随机变量的函数的乘积形式的操作, 称之为概率无向图的因子分解(factorization)。
      那么概率无向图模型的联合概率分布 P(Y) 可以表示为:

      P(Y)=CψC(YC)yCψC(YC)

      其中, C 是无向图中的最大团,YC C 的结点对应的随机变量, ψC(YC) C 上定义的严格正函数,乘积是在所有的最大团上进行的。


      条件随机场

      定义

      条件随机场时给定随机变量X的条件下,随机变量 Y 的马尔可夫随机场。 设X Y 是随机变量,P(YX)是在给定 X 的条件下Y的条件概率分布。若随机变量 Y 构成一个由无向图G=(V,E)表示的马尔可夫随机场,即 P(YvX,Yw,wv)=P(YvX,Yw,wv) 对任意结点 v 都成立,则称条件概率分布P(YX)为条件随机场(CRF)。

      定义(线性链条件随机场) 设 X=(X1,X2,,n),Y=(Y1,Y2,,Yn) 均为线性链表示的随机变量序列,若在给定随机变量序列 X 的条件下,随机变量序列Y的条件概率分布 P(YX) 构成条件随机场,即满足马尔可夫性: P(YiX,Y1,Y2,,Yi1,Yi+1,,Yn)=P(YiX,Yi1,Yi+1,,Yn) ,则称 P(YX) 为线性链条件随机场。在标注问题中, X 表示输入观测序列,Y表示对应的输出标记序列或者状态序列。

      参数形式

      简化形式

      矩阵形式


      概率计算问题

      前向-后向算法


      学习算法

      极大似然估计


      Reference:
      [1]李航:《统计学习方法》

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值