隐马尔可夫模型问题一：求模型观测序列的概率

最新推荐文章于 2022-11-11 22:26:58 发布

Starry memory

最新推荐文章于 2022-11-11 22:26:58 发布

阅读量1.9k

点赞数 6

分类专栏：人工智能文章标签：算法

本文链接：https://blog.csdn.net/doswynkfsw/article/details/123612369

版权

人工智能专栏收录该内容

41 篇文章 1 订阅

订阅专栏

背景

隐马尔可夫模型关注的三个问题中，第一个是求模型观测序列的概率。

暴力求解

已知HMM模型的参数 $\lambda = [{\bf{A,B,\pi }}]$ ， ${\bf{A}}$ 是隐藏状态转移概率矩阵， ${\bf{B}}$ 是观测状态概率矩阵。对于隐藏状态的初始概率分布记作 ${\bf{\pi }}$ 。已知观测序列 $\{ {o_1},{o_2}, \cdots ,{o_i}, \cdots ,{o_M}\}$ ，现在我们需要求出 $P(O|\lambda )$ 出现的条件概率。首先已经知道 ${\bf{B}}$ ，即隐藏状态到观测状态的概率，已经知道 ${\bf{A}}$ ，即隐藏态之间的转移概率。然后，我们可以直接使用暴力求解的方式。暴力求解过程如下所示：
（1）任意隐藏序列出现的概率表示为：
$P(I|\lambda ) = {\pi _{{i_1}}}{a_{{i_1}{i_2}}}{a_{{i_2}{i_3}}} \cdots {a_{{i_{T - 1}}{i_T}}}$
（2）已知隐藏序列，求观察序列的概率，表示为：
$P(O|I,\lambda ) = {b_{{i_1}}}({o_1}){b_{{i_2}}}({o_2}) \cdots {b_{{i_T}}}({o_T})$
（3）隐藏序列和观察序列的联合概率表示为：
$P(O,I|\lambda ) = P(I|\lambda )P(O|I,\lambda ) = {\pi _{{i_1}}}{b_{{i_1}}}({o_1}){a_{{i_1}{i_2}}}{b_{{i_2}}}({o_2}) \cdots {a_{{i_{T - 1}}{i_T}}}{b_{{i_T}}}({o_T})$
（4）求边缘概率分布，即观测序列 $O$ 在模型 $\lambda$ 下的概率。
$P(O|\lambda ) = \sum\limits_I {P(O,I|\lambda )} = \sum\limits_{{i_1},i{}_2, \cdots ,{i_T}} {{\pi _{{i_1}}}{b_{{i_1}}}({o_1}){a_{{i_1}{i_2}}}{b_{{i_2}}}({o_2}) \cdots {a_{{i_{T - 1}}{i_T}}}{b_{{i_T}}}({o_T})}$
暴力求解的方法仅仅适用于隐藏状态极少的模型，如果隐藏状态过多，会导致计算量非常的庞大，隐藏状态是未知的，需要考虑所有的隐藏状态。状态数为 $M$ ，那么将会有 ${M^T}$ 时间的复杂度， $T$ 表示隐藏序列的长度。总的时间复杂度为 $T{M^T}$ 。

前向算法求HMM观测序列概率

前向算法的本质是属于动态规划，通过子问题找到全局的最优解，子问题在这里被称为局部状态。对于前向算法，局部状态为前向概率，前向概率指给定时刻下从隐藏态到观察态的概率。定义 $t$ 时刻的隐藏状态的前向概率为：
${\alpha _1}(i) = {\pi _i}{b_i}({o_1}),{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} i = 1,2, \cdots ,N$
然后，递推 $\cdots ,T$ 时刻的概率：
${\alpha _{t + 1}}(i) = \left[ {\sum\limits_{j = 1}^N {{\alpha _t}(j){a_{ji}}} } \right]{b_i}({o_{t + 1}}),{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} i = 1,2, \cdots ,N$
最后，计算观测序列在给定模型下的概率：
$P(O|\lambda ) = \sum\limits_{i = 1}^N {{\alpha _T}(i)}$

前向算法求解实例

给定三个盒子，每个盒子里面都有两种颜色的球，分别为红色和白色。三个盒子中，球的数量分别是：

盒子名称	1号盒子	2号盒子	3号盒子
红色球数量	5	4	7
白色球数量	5	6	3

从不同的盒子中取球，并且从1号盒子取球的概率为0.2，从2号盒子取球的概率是0.4，从3号盒子取球的概率是0.4，总体概率为1。即初始的状态分布：
$\prod = {(0.2,0.4,0.4)^T}$
其次，状态转移概率矩阵为：
${\bf{A}} = \left( {\begin{matrix} {0.5}&{0.2}&{0.3}\\ {0.3}&{0.5}&{0.2}\\ {0.2}&{0.3}&{0.5} \end{matrix}} \right)$
观测状态概率矩阵为：
${\bf{B}} = \left( {\begin{matrix} {0.5}&{0.5}\\ {0.4}&{0.6}\\ {0.7}&{0.3} \end{matrix}} \right)$
求解问题，给定观测序列{红，白，红}，求出这个观测序列的概率是多少？
具体求解过程如下所示：
（1）在第1时刻观察到红色球，此时计算三个状态的前向概率：
盒子1的前向概率：
${\alpha _1}(1) = {\pi _1}{b_1}({o_1}) = 0.2 \times 0.5 = 0.1$
盒子2的前向概率：
${\alpha _1}(2) = {\pi _2}{b_2}({o_1}) = 0.4 \times 0.4 = 0.16$
盒子3的前向概率：
${\alpha _1}(3) = {\pi _3}{b_3}({o_1}) = 0.4 \times 0.7 = 0.28$

（2）依据递推式，递推第2时刻三个状态的前向概率，观察为白色球，
盒子1的前向概率：
${\alpha _2}(1) = \left[ {\sum\limits_{i = 1}^3 {{\alpha _1}(i){a_{i1}}} } \right]{b_1}({o_2}) = [0.1*0.5 + 0.16*0.3 + 0.28*0.2] \times 0.5 = 0.077$

盒子2的前向概率：
${\alpha _2}(2) = \left[ {\sum\limits_{i = 1}^3 {{\alpha _1}(i){a_{i2}}} } \right]{b_2}({o_2}) = [0.1*0.{\rm{2}} + 0.16*0.{\rm{5}} + 0.28*0.{\rm{3}}] \times 0.{\rm{6}} = 0.{\rm{1104}}$

盒子3的前向概率：
${\alpha _2}({\rm{3}}) = \left[ {\sum\limits_{i = 1}^3 {{\alpha _1}(i){a_{i{\rm{3}}}}} } \right]{b_{\rm{3}}}({o_2}) = [0.1*0.{\rm{3}} + 0.16*0.{\rm{2}} + 0.28*0.{\rm{5}}] \times 0.{\rm{3}} = 0.{\rm{0606}}$

（3）依据递推式，递推第3时刻三个状态的前向概率，观察为红色球，
盒子1的前向概率：
${\alpha _{\rm{3}}}(1) = \left[ {\sum\limits_{i = 1}^3 {{\alpha _2}(i){\alpha _{i1}}} } \right]{b_1}({o_3}) = [0.077*0.5 + 0.1104*0.3 + 0.0606*0.2] \times 0.5 = 0.04187$
盒子2的前向概率：
${\alpha _{\rm{3}}}(2) = \left[ {\sum\limits_{i = 1}^3 {{\alpha _2}(i){\alpha _{i2}}} } \right]{b_2}({o_3}) = [0.077*0.2 + 0.1104*0.5 + 0.0606*0.3] \times 0.4 = 0.03551$

盒子3的前向概率：
${\alpha _{\rm{3}}}(3) = \left[ {\sum\limits_{i = 1}^3 {{\alpha _3}(i){\alpha _{i3}}} } \right]{b_3}({o_3}) = [0.077*0.3 + 0.1104*0.2 + 0.0606*0.5] \times 0.7 = 0.05284$
最终，我们求出观测序列为{红，白，红}的概率为：
$P(O|\lambda ) = \sum\limits_{i = 1}^3 {{\alpha _3}(i)} = 0.13022$

后向算法求HMM观测序列概率

后向算法求HMM观测序列的概率和前向算法求HMM观测序列的概率是相似的。它们之间的区别主要在动态规划的递推式恰好是相反的。
定义 $t$ 时刻的隐藏状态的前向概率为：
${\beta _T}(i) = 1,{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} i = 1,2, \cdots ,N$

然后，递推 $\cdots ,1$ 时刻各个隐藏状态的后向概率：
${\beta _t}(i) = \sum\limits_{j = 1}^N {{a_{ij}}{b_j}({o_{t + 1}}){\beta _{t + 1}}(j)} ,{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} i = 1,2, \cdots ,N$

最后，计算观测序列在给定模型下的概率:
$P(O|\lambda ) = \sum\limits_{i = 1}^N {{\pi _i}{b_i}({o_1}){\beta _1}(i)}$

Starry memory

关注

6
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
隐马尔可夫模型问题一：求模型观测序列的概率

背景隐马尔可夫模型关注的三个问题中，第一个是求模型观测序列的概率。暴力求解已知HMM模型的参数λ=[A,B,π]\lambda = [{\bf{A,B,\pi }}]λ=[A,B,π]， A{\bf{A}}A是隐藏状态转移概率矩阵，B{\bf{B}}B是观测状态概率矩阵。对于隐藏状态的初始概率分布记作π{\bf{\pi }}π。已知观测序列O={o1,o2,⋯ ,oi,⋯ ,oM}O = \{ {o_1},{o_2}, \cdots ,{o_i}, \cdots ,{o_M}\}O={o1,o2
复制链接

扫一扫