条件随机场 (conditional random fields )模型

条件随机场(CRF)是一种判别式模型,常用于序列标注问题,解决了最大熵马尔科夫模型的标记偏置问题。CRF不仅考虑当前标记,还考虑上下文标记的转移概率,通过全局参数优化进行解码。本文介绍了CRF的基本概念、与生成模型的区别、概率图模型以及与HMM的比较,强调了CRF在自然语言处理任务中的优势和应用。
摘要由CSDN通过智能技术生成

条件随机场模型是由Lafferty在2001年提出的一种典型的判别式模型。它在观测序列的基础上对目标序列进行建模,重点解决序列化标注的问题条件随机场模型既具有判别式模型的优点,又具有产生式模型考虑到上下文标记间的转移概率,以序列化形式进行全局参数优化和解码的特点,解决了其他判别式模型(如最大熵马尔科夫模型)难以避免的标记偏置问题。

条件随机场模型(conditional random fields )是一种无向图模型,它是在给定需要标记的观察序列的条件下,计算整个标记序列的联合概率分布,而不是在给定当前状态条件下,定义下一个状态的状态分布。即给定观察序列O,求最佳序列S。

—预备知识
  —产生式模型和判别式模型(Generative model vs. Discriminative model)
—概率图模型

(1)机器学习方法的两种分类:产生式模型和判别式模型


假定输入x, 类别标签y


—产生式模型(生成模型)估计联合概率 P(x, y), 因可以根据联合概率来生成样本 —: HMMs
—判别式模型(判别模型)估计条件概率 P(y|x), 因为没有x的知识,无法生成样本,只能判断分类: SVMs,CRF,MEM
  举例:(o和s分别代表观察序列和标记序列)
(1,0), (1,0), (2,0), (2, 1)
产生式模型:

1)p(x, y):P(1, 0) = 1/2, P(1, 1) = 0, P(2, 0) = 1/4, P(2, 1) = 1/4.

 2)构建o和s的联合分布p(s,o)

3)产生式模型中,观察序列作为模型的一部分;

4)产生式模型:无穷样本==》概率密度模型 = 产生模型==》预测

判别式模型:

1)P(y|x):P(0|1) = 1, P(1|1) = 0, P(0|2) = 1/2, P(1|2) = 1/2
2)构建o和s的条件分布p(s|o)
3)判别式模型中,观察序列只作为条件,因此可以针对观察序列设计灵活的特征。
4)判别式模型:有限样本==》判别函数 = 预测模型==》预测
    一般认为判别型模型要好于生成型模型,因为它是直接根据数据对概率建模,而生成型模型还要先求两个难度相当的概率
概率图模型
1)用图的形式表示概率分布
2)基于概率论中贝叶斯规则建立起来的,解决不确定性问题,可以用于人工智能、 数据挖掘、 语言处理文本分类等领域
     图模型是表示随机变量之间的关系的图,图中的节点表示随机变量,缺少边表示条件独立假设。因此可以对联合分布提供一种紧致表示
3)根据边是否有方向,有两种主要的图模型
无向图:亦称马尔科夫随机场(Markov Random Fields, MRF’s)或马尔科夫网络(Markov Networks)
有向图:亦称贝叶斯网络(Bayesian Networks)或信念网络(Belief Networks, BN’s).
混合图模型,有时称为链图(chain graphs)
例如:其中有两个概念:位置(site),相空间(phase space)。“位置”好比是一亩亩农田;“相空间”好比是种的各种庄稼。我们可以给不同的地种上不同的庄稼,这就好比给随机场的每个“位置”,赋予相空间里不同的值。所以,俗气点说,随机场就是在哪块地里种什么庄稼的事情。
—简单地讲,随机场可以看成是一组随机变量的集合(这组随机变量对应同一个样本空间)。当给每一个位置中按照某种分布随机赋予相空间的一个值之后,其全体就叫做随机场。(当然,这些随机变量之间可能有依赖关系,一般来说,也只有当这些变量之间有依赖关系的时候,我们将其单独拿出来看成一个随机场才有实际意义。)
  4)具有马尔科夫性质
5)体现了一个思想:离当前因素比较遥远(这个遥远要根据具体情况自己定义)的因素对当前因素的性质影响不大。
   

1 链式条件随机场模型的图结构

clip_image002

2 条件随机场模型的分解式

  • 5
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值