HMM之维特比算法

最新推荐文章于 2024-01-26 09:04:24 发布

warrioR_wx

最新推荐文章于 2024-01-26 09:04:24 发布

阅读量7.8k

点赞数

分类专栏： NLP算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangxinginnlp/article/details/7852904

版权

NLP算法专栏收录该内容

4 篇文章 0 订阅

订阅专栏

还是上节的妹子问题。

http://blog.csdn.net/hellonlp/article/details/7849208

现在是解码问题。什么是解码问题呢？请看下面。

现在给定了一个妹子（指定模型HMM），有人告诉你某个连续五天妹子表现，即观察序列为（打，不打，打，打，不打）。再不是评估问题问你这个观察序列以后出现的概率是多少。这回是需要你结合观察序列去推测这个妹子那几天最可能的心情变化。心情变化是（高兴，生气，高兴，平静，生气），还是（生气，生气，高兴，平静，平静）呢？还是其他心情？

看到妹子连续的表现，推测心情的变化。这就是解码问题。

这个问题有个直接的办法。把所有情况列出来一一求解呗。

那么就是分别计算 P( （打，不打，打，打，不打） | （高兴，生气，高兴，平静，生气）)

P( （打，不打，打，打，不打） | （生气，生气，高兴，平静，平静）)

　…………

然后，看看那个概率最大。OK，最大的那个概率就是要求得的。但计算太麻烦了。

《统计学习方法》中介绍个近似算法。就是计算每个时段 t 最可能出现的状态。比如在 t = 3，我们由上节的前向算法可以得到这个时段状态分别是高兴，平静，生气时候的概率。然后看谁大就选谁。

比如分别计算

在t = 3 时看到观测序列为（打，不打，打）, 并且现在 t = 3 时候妹子心情状态为高兴的概率。

在t = 3 时看到观测序列为（打，不打，打）, 并且现在 t = 3 时候妹子心情状态为平静的概率。

在t = 3 时看到观测序列为（打，不打，打）, 并且现在 t = 3 时候妹子心情状态为生气的概率。

最后看这个里面谁大我就选谁。

算法里面学过动态规划的，一看就知道很大的问题。动态规划应该可以告诉这个问题。

维特比（Viterbi）算法

这就是个动态规划解马尔科夫模型的解码问题。

动态规划问题参见 : http://blog.csdn.net/hellonlp/article/details/7849208

现在问题就简单多了，把过路收费多少问题，看成概率大小的问题。就可以搞定的。

定义两个变量：Q_t ( i ) 为时刻 t 状态为 i的所有单个路径（i_1， i_2, …………i_t）中概率最大值

公式1

R_t ( i )为时刻 t 状态为 i的所有单个路径（i_1， i_2, …………i_t）中概率最大路径的前一个段t - 1中的状态结点的编号。

说白点，就是Q_t (i)就是在时刻 t 妹子的心情为第 i 种（高兴，生气，平静）的最大概率。举例现在 t = 3时候，看到的 (打，不打，打)。在此时妹子心情为 i = 1 （高兴）时候最大的概率。

有很多中可能的情况：（按照公式1）

P（i_t = 高兴，高兴，平静，打，不打，打 | 此人模型）

P（i_t = 高兴，生气，平静，打，不打，打 | 此人模型）

……………………

从中选出概率最大的一个。假设是第一个，那么公式中的单个路径就是（平静，高兴，高兴）这条路径（跟动态规划问题中经过收费站选择路线的问题挂钩了）。

此时的R_t(i = 3)是什么呢？就是上述最大概率路径中前一个段（t = 2）的状态编号，也就是上述（平静，高兴，高兴）路径中间那个高兴的编号，就是1 号嘛。这个变量在512nlp称之为反向指针。就是指向该结点所处最好的那个路径的前一个结点的编号。

知道动态规划和上述变量后，我们可以依次计算每天妹子各种心情变化的概率。

第一天由于没有前一天，和上一节前向算法一样，P(state | t = 1) = P(state)，因此，t = 1 时的概率等于当前状态的初始概率乘以相关的混淆概率。

也就是分别算出P(高兴，打|M)，P( 平静，打|M),P(生气，打|M)的概率。

然后根据这个概率去递推第二天的 R_t ( i ) 变量的概率，还有分别算出他们的反向指针。

也就是在第一天打人，第二天不打人，第二天心情分别为高兴，生气，平静三种情况下各自的最大概率。

接着根据第二天概率去递推第三天的 R_t ( i ) 变量的概率，还有分别算出他们的反向指针。

也就是在第一天打人，第二天不打人，第三天打人，第三天心情分别为高兴，生气，平静三种情况下各自的最大概率。

………………

最后计算出

也就是在第一天打人，第二天不打人，第三天打人，第四天打人，第五天不打人。第五天心情分别为高兴，生气，平静三种情况下各自的最大概率。

上述三种情况对应着三种路径（类似平静，高兴，高兴，……）。概率最大者，就是所说的最可能的情况。

问题到此还没有完，还需要使用反向指针，反向着往前慢慢推出该路径的各个状态。也就是使用反向指针递推着计算第四天，第三天，……，第一天的心情状态。

这样，打工告成，我们就结合观察序列推测这个妹子那几天最可能的心情变化。

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
HMM之维特比算法

还是上节的妹子问题。http://blog.csdn.net/hellonlp/article/details/7849208现在是解码问题。什么是解码问题呢？请看下面。现在给定了一个妹子（指定模型HMM），有人告诉你某个连续五天妹子表现，即观察序列为（打，不打，打，打，不打）。再不是评估问题问你这个观察序列以后出现的概率是多少。这回是需要你结合观察序列去推测这个妹子那几
复制链接

扫一扫

专栏目录

warrioR_wx CSDN认证博客专家 CSDN认证企业博客

码龄13年

113: 原创

12万+: 周排名

48万+: 总排名

50万+: 访问

: 等级

5912: 积分

387: 粉丝

216: 获赞

217: 评论

256: 收藏

私信

关注

热门文章

分类专栏

java 5篇
java 正则表达式 1篇
python 7篇
算法 11篇
NLP算法 4篇
NLP 14篇
学习笔记 61篇
C++ 3篇
deep learning 12篇
NLP工具 1篇
学术心得 4篇
NMT 1篇

最新评论

T2T Transformer 笔记
Q_602715610: 问一下这个是什么问题： File "/Users/qiukun/opt/anaconda3/lib/python3.9/site-packages/gym/envs/registration.py", line 133, in _kwargs = self.kwargs.copy() AttributeError: 'NoneType' object has no attribute 'copy'
小心python的list乘法
William6102: a=[[1]*col]*row 为什么两层的时候，不会改变所有元素，只改变最里面的一层。
中文词汇语义相关度的测试集（免费）
柠檬の夏: 404了
神经机器翻译中的领域自适应问题 Domain adaptation for NMT
Tisfy: 我曾经忘情于汉廷的歌赋，但刚发现此文甚妙！
小心python的list乘法
xuhaopeng1224: 今天遇到了这个坑，一直以为自己写错了代码哈哈哈

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。