HMM算法学习笔记

最新推荐文章于 2022-03-09 12:44:54 发布

cj1064789374

最新推荐文章于 2022-03-09 12:44:54 发布

阅读量394

点赞数

分类专栏： 2020年研究生学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cj1064789374/article/details/106757111

版权

2020年研究生学习笔记专栏收录该内容

28 篇文章 6 订阅

订阅专栏

本文将讲解HMM的各种算法运用

背景：有３个色子ABC，编号是1到m（此例中取3），每个色子可掷1到6，但分布律各不相等，现在我掷n次，每次随机取一个色子随机掷得一个点数并记为X[i]，但是我不知道每次掷的色子是哪个色子。

概念引入：

隐藏状态数：m，现在是3种色子，所以隐藏状态数是3种

输出状态数：s，可掷到的数是1到6，所以输出状态数是6种

隐藏状态链：取得的色子编号序列

可见状态链：X[i]序列（i从1到n）

初始向量：向量π中元素π[i]表示首次取色子时，取到色子编号为i的概率

输出矩阵：矩阵B中元素B[j][k]表示这次抽到的色子是M[j]，掷得点数是k的概率

转移矩阵：矩阵A中元素A[i][j]表示上次抽到的色子是M[i]，这次抽到的色子是M[j]的概率

问题一：最简单的动态规划

已知：隐藏状态数，输出状态数，可见状态链，初始向量，转移矩阵，输出矩阵

求解：问得到这串可见状态链的概率

方法一：前向算法

设置变量：DPA[i]表示第i次抽到的色子是A且能掷出可见状态链前i个点数的概率，DPB与DPC同理

初始状态：DPA[1]=P(A)*P(A->X[1])，DPB[1]=P(B)*P(B->X[1])，DPC[1]=P(C)*P(C->X[1])

动态规划：for(int i=2;i<=n;i++)循环执行下面三行

DPA[i]={DPA[i-1]*P(A->A)+DPB[i-1]*P(B->A)+DPC[i-1]*P(C->A)}*P(A->X[i])

DPB[i]={DPA[i-1]*P(A->B)+DPB[i-1]*P(B->B)+DPC[i-1]*P(C->B)}*P(B->X[i])

DPC[i]={DPA[i-1]*P(A->C)+DPB[i-1]*P(B->C)+DPC[i-1]*P(C->C)}*P(C->X[i])

最终结果：max(DPA[n]，DPB[n]，DPC[n])

补充说明：

P(A)= π[1]，P(A->X[i])=B[1][i]，P(A->A)=A[1][1]，P(A->B)=A[1][2]，P(A->C)=A[1][3]

P(B)= π[2]，P(B->X[i])=B[2][i]，P(B->A)=A[2][1]，P(B->B)=A[2][2]，P(B->C)=A[2][3]

P(C)= π[3]，P(C->X[i])=B[3][i]，P(C->A)=A[3][1]，P(C->B)=A[3][2]，P(C->C)=A[3][3]

方法二：后向算法

设置变量：DPA[i]指第i次抽到的色子是A且能掷出可见状态链第i到n个点数的概率，DPB与DPC同理

初始状态：DPA[n]= P(A->X[n])，DPB[n]= P(B->X[n])，DPC[n]= P(C->X[n])

动态规划：for(int i=n;i>=2;i++)循环执行下面三行

DPA[i-1]={DPA[i]*P(A->A)+DPB[i]*P(A->B)+DPC[i]*P(A->C)}*P(A->X[i])

DPB[i-1]={DPA[i]*P(B->A)+DPB[i]*P(B->B)+DPC[i]*P(B->C)}*P(B->X[i])

DPC[i-1]={DPA[i]*P(C->A)+DPB[i]*P(C->B)+DPC[i]*P(C->C)}*P(C->X[i])

最终结果：max(P(A)*DPA[1]，P(B)*DPB[1]，P(C)*DPC[1])

补充说明：

P(A)= π[1]，P(A->X[i])=B[1][i]，P(A->A)=A[1][1]，P(A->B)=A[1][2]，P(A->C)=A[1][3]

P(B)= π[2]，P(B->X[i])=B[2][i]，P(B->A)=A[2][1]，P(B->B)=A[2][2]，P(B->C)=A[2][3]

P(C)= π[3]，P(C->X[i])=B[3][i]，P(C->A)=A[3][1]，P(C->B)=A[3][2]，P(C->C)=A[3][3]

问题二：对比前文把求和变求最大值，带记忆数组回溯的动态规划

已知：隐藏状态数，输出状态数，可见状态链，初始向量，转移矩阵，输出矩阵

求解：求最大概率对应的隐藏状态链

方法：动态规划－维特比算法

设置变量：

DP[i][j]表示第i次抽到的色子编号是j，能掷出可见状态链前i个点数的概率

res[i][j]表示第i次抽到的色子编号是j，是从从i-1状态中哪个色子转移过来

初始状态：

for(int j=1;j<=m;j++)DP[1][j]=π[i]*B[j][X[i]];

for(int i=2;i<=n;i++)for(int j=1;j<=m;j++)DP[i][j]=0;

动态规划：

for(int i=2;i<=n;i++)//第i次抽

for(int j=1;j<=m;j++)//这一次抽到j号色子

for(int k=1;k<=m;k++)//上一次抽的是k号色子

If(DP[i][j]<DP[i-1][k]*A[k][j]*B[i][X[i]]){

DP[i][j]=DP[i-1][k]*A[k][j]*B[i][X[i]];

res[i][j]=k;

}

最终结果：

Answer[n]=for(int i=1;i<=m;i++)max(Answer[n],DP[n][i]);

for(int i=n-1;i>=1;i--)Answer[i]=res[i][Answer[i+1]];

则Answer数组序列就是第1到n次取到的色子编号

问题三：

(引用自https://www.cnblogs.com/pinard/p/6972299.html)

上面是已知部分隐藏链的直接最大似然，下面是不知隐藏链的用鲍姆-韦尔奇算法

已知：隐藏状态数（事先人为预判），输出状态数（从可见状态链中数出来），可见状态链（相当于唯一已知条件）

求解：求初始向量，转移矩阵，输出矩阵

方法：鲍姆-韦尔奇算法

补充说明：

π[i]是初始向量，aij即A[i][j]转移矩阵，bjk即B[j][k]输出矩阵，在第一步随机赋值

一共有D组样本(用d遍历），每组样本各抽掷色子T次(用t遍历）

表示第d组样本第t次掷色子掷到点数是i概率，其实就是B[j][k]的预测值

表示第d组样本第t次取色子取到j号色子概率，已知上次取到i号色子，其实就是A[i][j]预测值

表示第d组样本第t次掷色子是否掷到vk

此处的O[t]相当于前文设的X[i]可见状态链，vk就是前面bjk中规定输出点数是k

为什么要写成vk，那是因为我前文规定点数取值范围是1开始的自然数而已，但实际上色子可掷得的点数取值范围可以是234567，这样就vk=k+1，k仍是取1到6，写成vk可以更加抽象，更加一般性

补充：鲍姆-韦尔奇算法抽象起来叫EM算法思想，在聚类时就是这种思想

不断迭代，先E步，再M，下面列举一个简单的EM算法例子演算过程

例子引用自：https://zhuanlan.zhihu.com/p/40991784

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HMM算法学习笔记

本文将讲解HMM的各种算法运用背景：有３个色子ABC，编号是1到m（此例中取3），每个色子可掷1到6，但分布律各不相等，现在我掷n次，每次随机取一个色子随机掷得一个点数并记为X[i]，但是我不知道每次掷的色子是哪个色子。概念引入：隐藏状态数：m，现在是3种色子，所以隐藏状态数是3种输出状态数：s，可掷到的数是1到6，所以输出状态数是6种隐藏状态链：取得的色子编号序列可见状态链：X[i]序列（i从1到n）初始向量：向量π中元素π[i]表示首次取色子时，取到色子编号为i的概率输出
复制链接

扫一扫

专栏目录

cj1064789374 CSDN认证博客专家 CSDN认证企业博客

码龄7年

548: 原创

3万+: 周排名

55万+: 总排名

60万+: 访问

: 等级

9159: 积分

272: 粉丝

500: 获赞

106: 评论

1660: 收藏

私信

关注

热门文章

分类专栏

最新评论

科学计算器按键功能汇总
重阳巷: 没cl和dt
计算机组成浮点数补码规格化负数表示范围
做而论道_CS: 至于移码，可以理解为：　对二进制数的 ”加密、解密“。加密：二进制数＋偏移量＝移码。解密：移码－偏移量＝二进制数。偏移量，是神马数值呢？　在不同的应用场合，偏移量有不同的数值。　　到时候，你就知道了。这种加解密的方法，也太简单了！　小事一桩，不值一提。
计算机组成浮点数补码规格化负数表示范围
做而论道_CS: 另外，由补码换算到十进制数，也极其简单。你只需记住：【补码首位的权，是负数】。一般的八位二进制数，各个位的权是：　　128、64、32、16、8、4、2、1；如果是八位的补码，各个位的权则是：　－128、64、32、16、8、4、2、1。　例如，有一个补码：1110 0001，它代表的十进制是：－128 + 64 + 32 + 1= －31。再看，另一个补码：0110 0001，它代表的十进制是：0 + 64 + 32 + 1 = ＋97。仅仅使用【进制转换】，不就完事了！－－－－－－－－－－－－－－－－－－－－－－那么，所谓的：　机器数真值符号位原码反补码正数三码与正数相同　负数取反加一符号位不变符号位也参加运算模同余 ... 这一大堆乱七八糟的概念，不都是垃圾嘛！进位，是小学二年级的知识点吧？　舍弃进位，很难理解吗？　老外竟然能弄出那么大一堆概念！　老外的数学水平，由此可见一斑。谁要是跟老外学算术，立刻、马上，直接就掉沟里去了！我们的计算机老师，也不懂数学，只知道跟风。　一天一天的，在大学里，兜着圈子讲小学的知识。　真是毁人不倦坑人不浅！这些老师，捡个鞋拔子就当成玉如意了。　天天蒙骗学生，赚取名声和丰厚的讲课费。　　顺便再抓几个学生挂科，抖一下威风！现在知道我们缺芯片用的原因了吧！
计算机组成浮点数补码规格化负数表示范围
做而论道_CS: 在两位十进制中，舍弃进位，就是【减去了一百】。因此，加 99、再减 100，当然就是 “－1” 了。同理，+98，就是 “－2” 。。。。　。。。二进制数，也是数，并非是什么原码反码补码。八位二进制数就是：0000 0000 ~ 1111 1111。就相当于十进制数：0 ~ 255。如果有进位，就是：256。那么，加 255、减 256，也就是 “－1” 了！所以，+255 (1111 1111)，就是－1。同理，+254 (1111 1110)，就是－2。　　　+253 (1111 1101)，就是－3。　　　。。。　。。。最后，+128 (1000 0000)，就是－128。以上这些正数，就是计算机专家 “发明” 的补码。你如果上过中学，你一定能导出关系式：　负数的补码 = 256 ＋该负数。一般化，就是：　负数的补码 = 2^n ＋该负数。　n，是二进制数的位数。例：求－31 的 “补码” 是多少？解：256－31 = 225 = 1110 0001 (二进制)。这不就求出来了吗？哪里还用：符号位原码反码取反加一！同样，求正数的补码，也是用此公式：　正数的补码 = 2^n ＋该正数。　n，是二进制的位数。但是，正数加上 2^n，就会出现进位。进位必须舍弃，所以，2^n 就不用加了。因此，你就可以简化公式如下：　正数的补码 = 该正数。在此处，你就证明了：　零和正数的补码，就是该数本身。计算机专家，也曾这么说过。　但是，他们并没有给出证明。为什么呢？　因为，他们弄不懂什么是舍弃进位。
计算机组成浮点数补码规格化负数表示范围
做而论道_CS: 虽然，计算机使用的是：二进制数。但是，二进制数，也是数。　并不是什么：机器数原码反码补码。二进制数本身，就是真值。所谓的 “补码”，也不仅仅是二进制才有。任意的进制，都有 “补码” 存在。你看十进制吧，两位数，就是：0 ~99。可以有：27 + 99 (一百) 26 　　　　27 － 1 = 26 只有你忽略进位，仍然取两位数，　这两种算法，就是相同的。即，舍弃进位，就可以：　用正数，当做负数；　用加法，实现减法运算。在计算机中，舍弃进位，会怎样？　能够简化硬件。　只用一个加法器，便可横行天下！你如果懂得什么是【舍弃进位】，　你就能理解 “补码” 的来历与意义。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。