HMM-维特比算法

文章介绍了HMM(隐马尔科夫模型)中的维特比算法,这是一种动态规划方法,主要用于词性标注。通过计算发射概率和转移概率的乘积,找到给定序列的最可能状态路径。在词性标注任务中,算法遍历每个单词,计算每个词性到下一个词性的最优路径,最终选取概率最高的路径作为结果。
摘要由CSDN通过智能技术生成

HMM回顾

这个不知道的可以去看看HMM
最终的公式可以解释主要分为两个部分:

  • P(xi|yi),发射概率,字面意思是从一个词性中发射/生成出某一个单词的概率
  • P(yi|yi-1),转移概率,表示从一个词性转移到下一个词性的概率
    这两个概率都可以通过标注文档中统计得出

隐马科夫链解法:维特比算法(Viterbi)

维特比算法其思想就是动态规划,下面以HMM进行词性标注讲解维特比算法。
在这里插入图片描述

上图中,我们需要对 “natural language processing ( nlp )” 这句话进行词性标注。最终目标是找到下图所示的最优可能路径。
在这里插入图片描述

求解顺序:

  1. 在natural这个词中(第一列),我们要保留所有可能的词性,因为每个词性后边都可能出现最优路径,这里需要求的概率是P(“natural”|词性),这个是可以根据我们输入的训练集(文档)统计得出。
  2. 在第二列中,我们需要求解发射概率转移概率。例如JJ,我们可以分别求出JJ->NN,JJ->JJ,JJ->VB,JJ->LRB,JJ->RRB的转移概率以及P(“language”|词性)的发射概率,发射概率*转移概率值最大的路径即为JJ的最优路径,同理我们可以对所有的词性都求出的一个最优路径。大概样子就变成了如下图所示(示意图,嘻嘻)
    在这里插入图片描述

注:我们在这里求解发射概率与转移概率的乘积时,为了避免精度损失,通常会对其取对数
3. 重复第二步,则最终结果如下图所示(示意图,嘻嘻)
*
其实最终利用维特比算法得到了“词性”(量词)条路径,从中选出概率最大路径即可

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值