HMM & CRF

1 篇文章 0 订阅
1 篇文章 0 订阅
本文探讨了HMM和CRF在序列标注任务,特别是命名实体识别(NER)中的运用。HMM作为生成模型,依赖于齐次马尔可夫和观测独立性假设,通过前向算法和Viterbi算法进行概率计算和解码。而CRF则是一种判别模型,直接建模观测序列给定的条件概率,同样利用前向算法和Viterbi算法,但更适用于考虑上下文信息的场景。
摘要由CSDN通过智能技术生成

主要介绍HMM和CRF在NER序列标注问题中的应用。

HMM

  • 例子:O O B I I I(我在浙江大学),状态序列是【O O B I I I】,观测序列是【我在浙江大学】
    属于生成模型,包含隐变量,要对x(状态)和y(观测)联合建模,即P(X,Y)。
  • 两个假设
    • 齐次马尔可夫假设:当前状态只有前一个状态有关,与其他状态和观测值无关
    • 观测独立性假设:当前观测值只跟当前状态有关,跟其他状态无关也跟其他观测值无关
  • 五元素
    观测集合:所有组成句子的字的集合A
    状态集合这里是S={B,I,O}(一般还隐式包括start和end两个特殊状态)
    发射概率:每个状态转移到每个字的概率P(Ai|Sj)
    状态转移概率:状态之间转移的概率P(Si|Sj)
    初始概率:每个状态作为第一个状态的概率
  • 训练
    分两种,一种是训练集包括句子和标注结果(大多数序列标注任务),这个时候用统计下五元素即可。第二种是只有观测序列,要用baum-welch算法预估参数。
  • 概率计算:给定观测集合,发射概率,状态转移概率、初始概率计算该观测集合出现的概率(计算所有可能的状态序列对应的观测集合的联合概率和):前向算法
  • 解码:给定马尔可夫模型和一个观测序列,判断最可能的状态序列:Viterbi算法

CRF

  • 例子 :我在浙江大学(O O B I I I),观测序列是【我在浙江大学】,状态序列是【O O B I I I】;X是【我在浙江大学】,Y是【O O B I I I】
    直接对P(Y|X)建模,属于给定输入序列对输出序列的判别模型,给定句子x(观测),判断标注序列的概率y(状态)
  • 概率计算:给定条件随机场P(Y|X)和输入序列x和输出序列y,计算在当前时刻t观测值为k的概率:前向算法
  • 解码:给定CRF模型和一个状态序列,判断最可能的观测序列:Viterbi算法
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值