条件随机场原理介绍

1. 引言

    条件随机场(Conditional random field,CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。条件随机场常用于序列标注问题,比如命名实体识别等。本文主要介绍线性链条件随机场。

2. 条件随机场原理介绍

2.1 概率无向图模型

    由于CRF要求输出随机变量构成马尔可夫随机场,因此,这一节先介绍什么是马尔可夫随机场,马尔可夫随机场也称为概率无向图模型,是一个由无向图表示的联合概率分布。

    图是由结点 v v v和连接结点的边 e e e组成的集合,结点和边的集合分别记作 V V V E E E,图记作 G = ( V , E ) G=(V, E) G=(V,E),无向图是指边没有方向的图。

    概率图模型是由图表示的概率分布,设有联合概率分布 P ( Y ) P(Y) P(Y) Y ∈ Y Y \in \mathcal{Y} YY是一组随机变量。由无向图 G = ( V , E ) G=(V, E) G=(V,E)表示概率分布 P ( Y ) P(Y) P(Y),即在图 G G G中,结点 v ∈ V v \in V vV表示一个随机变量 Y v Y_{v} Yv Y = ( Y v ) v ∈ V Y=\left(Y_{v}\right)_{v \in V} Y=(Yv)vV,边 e ∈ E e \in E eE表示随机变量之间的概率依赖关系。

    在介绍概率无向图模型之前,还需要介绍三个概念,即成对马尔可夫性、局部马尔可夫性、全局马尔可夫性。

  1. 成对马尔可夫性:设 u u u v v v是无向图 G G G中任意两个没有边连接的结点,结点 u u u v v v分别对应随机变量 Y u Y_{u} Yu Y v Y_{v} Yv,其他所有结点为 O O O,对应的随机变量组是 Y O Y_O YO,成对马尔可夫性是指给定随机变量组 Y O Y_O YO的条件下随机变量 Y u Y_{u} Yu Y v Y_{v} Yv是条件独立的,即: P ( Y u , Y v ∣ Y o ) = P ( Y u ∣ Y O ) P ( Y v ∣ Y O ) P\left(Y_{u}, Y_{v} | Y_{o}\right)=P\left(Y_{u} | Y_{O}\right) P\left(Y_{v} | Y_{O}\right) P(Yu,YvYo)=P(YuYO)P(YvYO)
  2. 局部马尔可夫性:设 v ∈ V v \in V vV是无向图 G G G中任意一个结点, W W W是与 v v v有边连接的所有结点, O O O v , W v, W v,W以外的其他所有结点, v v v表示的随机变量是 Y v Y_{v} Yv W W W表示的随机变量组是 Y W Y_{W} YW O O O表示的随机变量组是 Y O Y_{O} YO,局部马尔可夫性是指在给定随机变量组 Y W Y_{W} YW的条件下,随机变量 Y v Y_{v} Yv与随机变量组 Y O Y_{O} YO是独立的,即: P ( Y v , Y O ∣ Y W ) = P ( Y v ∣ Y W ) P ( Y O ∣ Y W ) P\left(Y_{v}, Y_{O} | Y_{W}\right)=P\left(Y_{v} | Y_{W}\right) P\left(Y_{O} | Y_{W}\right) P(Yv,YOYW)=P(YvYW)P(YOYW)
    在这里插入图片描述
  3. 全局马尔可夫性:设结点集合 A , B A, B A,B是在无向图 G G G中被结点集合 C C C分开的任意结点集合,结点集合 A , B , C A,B,C A,B,C所对应的随机变量组分别是 Y A , Y B , Y C Y_A,Y_B,Y_C YA,YB,YC,全局马尔可夫性是指给定随机变量组 Y C Y_C YC条件下随机变量组 Y A Y_A YA Y B Y_B YB是条件独立的,即: P ( Y A , Y B ∣ Y C ) = P ( Y A ∣ Y C ) P ( Y B ∣ Y C ) P\left(Y_{A}, Y_{B} | Y_{C}\right)=P\left(Y_{A} | Y_{C}\right) P\left(Y_{B} | Y_{C}\right) P(YA,YBYC)=P(YAYC)P(YBYC)
    在这里插入图片描述
        概率无向图模型的定义为,设有联合概率分布 P ( Y ) P(Y) P(Y),由无向图 G = ( V , E ) G=(V, E) G=(V,E)表示,在图 G G G中,如果联合概率分布 P ( Y ) P(Y) P(Y)满足成对、局部或全局马尔可夫性,则称此联合概率分布为概率无向图模型,或马尔可夫随机场。

    对于概率无向图模型,我们比较关心的是联合概率分布的计算,在实际的计算中,我们一般会将联合概率写成若干子联合概率乘积的形式,也就是将联合概率进行因子分解。

    根据Hammersley-Clifford定理,概率无向图模型的联合概率分布 P ( Y ) P(Y) P(Y)可以表示为如下形式:
P ( Y ) = 1 Z ∏ c Ψ C ( Y C ) Z = ∑ Y ∏ C Ψ C ( Y C ) \begin{array}{c}{P(Y)=\frac{1}{Z} \prod_{c} \Psi_{C}\left(Y_{C}\right)} \\ {Z=\sum_{Y} \prod_{C} \Psi_{C}\left(Y_{C}\right)}\end{array} P(Y)=Z1cΨC(YC)Z=YCΨC(YC)其中, C C C是无向图的最大团,无向图 G G G中任何两个结点均有边连接的结点子集称为团,若 C C C是无向图 G G G的一个团,并且不能再加进任何一个 G G G的结点使其成为一个更大的团,则称此 C C C为最大团。 Y C Y_{C} YC C C C的结点对应的随机变量, Ψ C ( Y C ) \Psi_{C}\left(Y_{C}\right) ΨC(YC) C C C上定义的严格正函数,一般定义为指数函数:
Ψ C ( Y C ) = exp ⁡ { − E ( Y C ) } \Psi_{C}\left(Y_{C}\right)=\exp \left\{-E\left(Y_{C}\right)\right\} ΨC(YC)=exp{ E(YC)} Z Z Z是规范化因子,是为了保证 P ( Y ) P(Y) P(Y)构成一个概率分布。

2.2 条件随机场的定义
2.2.1 条件随机场的定义

    条件随机场:设 X X X Y Y Y是随机变量, P ( Y ∣ X ) P(Y | X) P(YX)是在给定 X X X的条件下 Y Y Y的条件概率分布。若随机变量 Y Y Y构成一个由无向图 G = ( V , E ) G=(V, E) G=(V,E)表示的马尔可夫随机场,即 P ( Y v ∣ X , Y w , w ≠ v ) = P ( Y v ∣ X , Y w , w ∼ v ) P\left(Y_{v} | X, Y_{w}, w \neq v\right)=P\left(Y_{v} | X, Y_{w}, w \sim v\right) P(YvX,Yw,w̸=v)=P(YvX,Yw,wv)对任意结点 v v v成立,则称条件概率分布 P ( Y ∣ X ) P(Y | X) P(YX)为条件随机场,式中 w

  • 11
    点赞
  • 74
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值