用简单易懂的例子解释隐马尔可夫模型

最新推荐文章于 2023-02-11 15:55:18 发布

Jeff-Chow000

最新推荐文章于 2023-02-11 15:55:18 发布

阅读量472

点赞数

文章标签： 1024程序员节自然语言处理

本文链接：https://blog.csdn.net/u014611178/article/details/109252807

版权

本文通过一个简单的例子，详细解释了隐马尔可夫模型(HMM)的工作原理，包括初始概率分布、状态转移概率和观测概率。通过对连续三天身体感觉的分析，展示了如何运用HMM推断出隐藏的身体状态变化过程。通过前向算法和后向算法，求解观测序列的概率，并找出最优状态序列。HMM在自然语言处理等领域有着广泛应用。

摘要由CSDN通过智能技术生成

用简单易懂的例子解释隐马尔可夫模型

隐含的身体状态 = { 健康 , 发烧 }

可观察的感觉状态 = { 正常 , 冷 , 头晕 }

预判的身体状态初始概率分布 = { 健康：0.6 , 发烧：0.4 }

身体健康状态的转换概率分布 = {
健康->健康：0.7 ,
健康->发烧：0.3 ,
发烧->健康：0.4 ,
发烧->发烧：0.6
}

在相应健康状况条件下，感觉状态的概率分布 = {
健康，正常：0.5 ，冷：0.4 ，头晕： 0.1 ；
发烧，正常：0.1 ，冷：0.3 ，头晕： 0.6
}
连续三天的身体感觉依次是：正常、冷、头晕。

求：这三天的身体健康状态变化的过程是怎么样的？

(1) 初始情况：

P(第一天健康) = 0.6，P(第一天发烧)=0.4。

(2) 求第一天的身体情况：

计算在感觉正常的情况下最可能的身体状态：

P(第一天健康，感觉正常) = P(正常|第一天健康) * P(第一天健康) = 0.5 * 0.6 = 0.3

P(第一天发烧，感觉正常) = P(正常|第一天发烧) * P(第一天发烧) = 0.1 * 0.4 = 0.04

那么就可以认为第一天最可能的身体状态是：健康。

(3) 求第二天的身体状况：

计算在感觉冷的情况下最可能的身体状态。

P(第二天健康，感觉冷) = P(感觉冷|第二天健康) * P(第二天健康|第一天健康) * P(第一天健康) + P(感觉冷|第二天健康) * P(第二天健康|第一天发烧) * P(第一天发烧) = 0.4 * 0.7 * 0.6 + 0.4 * 0.4 * 0.4 = 0.232

P(第二天发烧，感觉冷) = P(感觉冷|第二天发烧) * P(第二天发烧|第一天健康) * P(第一天健康) + P(感觉冷|第二天发烧) * P(第二天发烧|第一天发烧) * P(第一天发烧) = 0.3 * 0.3 * 0.6 + 0.3 * 0.6 * 0.4 = 0.126

那么可以认为，第二天最可能的状态是：健康。

(4) 求第三天的身体状态：

计算在感觉头晕的情况下最可能的身体状态。

那么可以认为，第三天最可能的状态是：发烧。

用数学公式表达

初始概率分布：

$\pi(0) = \left[ \begin{array}{cc} 0.6 & 0.4 \end{array} \right]^T$

状态转移概率矩阵：

$\left[ \begin{array}{cc} 0.7 & 0.3 \\ 0.4 & 0.6 \end{array} \right]$

观测概率矩阵：

$\left[ \begin{array}{ccc} 0.5 & 0.4 & 0.1 \\ 0.1 & 0.3 & 0.6 \end{array} \right]$

实际运算：

$\pi(i+1) = A \pi(i) \\ B(i+1) = A B(i)$

例：

$\pi(1) = A \pi(0) = \left[ \begin{array}{cc} 0.7 & 0.3 \\ 0.4 & 0.6 \end{array} \right] \left[ \begin{array}{c} 0.6 \\ 0.4 \end{array} \right] =\left[ \begin{array}{cc} 0.54 \\ 0.48 \end{array} \right] \\ \pi(2) = A \pi(1) = \left[ \begin{array}{cc} 0.7 & 0.3 \\ 0.4 & 0.6 \end{array} \right] \left[ \begin{array}{c} 0.54 \\ 0.48 \end{array} \right] =\left[ \begin{array}{cc} 0.522 \\ 0.504 \end{array} \right] \\ \pi(3) = A \pi(2) = \left[ \begin{array}{cc} 0.7 & 0.3 \\ 0.4 & 0.6 \end{array} \right] \left[ \begin{array}{c} 0.522 \\ 0.504 \end{array} \right] =\left[ \begin{array}{cc} 0.5166 \\ 0.5112 \end{array} \right]$

和
$\left[ \begin{array}{cc} 0.7 & 0.3 \\ 0.4 & 0.6 \end{array} \right] \left[ \begin{array}{ccc} 0.5 & 0.4 & 0.1 \\ 0.1 & 0.3 & 0.6 \end{array} \right]= \left[ \begin{array}{cc} 0.38 & 0.37 & 0.25 \\ 0.26 & 0.34 & 0.4 \end{array} \right] \\ B(2) = A B(1) = \left[ \begin{array}{cc} 0.7 & 0.3 \\ 0.4 & 0.6 \end{array} \right] \left[ \begin{array}{cc} 0.38 & 0.37 & 0.25 \\ 0.26 & 0.34 & 0.4 \end{array} \right] =\left[ \begin{array}{cc} 0.344 & 0.361 & 0.295 \\ 0.308 & 0.352 & 0.34 \end{array} \right] \\ B(3) = A B(2) = \left[ \begin{array}{cc} 0.7 & 0.3 \\ 0.4 & 0.6 \end{array} \right] \left[ \begin{array}{cc} 0.344 & 0.361 & 0.295 \\ 0.308 & 0.352 & 0.34 \end{array} \right] =\left[ \begin{array}{cc} 0.3332 & 0.3583 & 0.3085 \\ 0.3224 & 0.3556 & 0.322 \end{array} \right]$

状态集合 $Q=\{1,2,3\}$ ，观测集合 $V=\{红,白\}$ 。

初始概率分布：
$\pi(0) = \left[ \begin{array}{cc} 0.2 & 0.4 & 0.4 \end{array} \right]^T$
状态转移概率矩阵：
$\left[ \begin{array}{cc} 0.5 & 0.2 & 0.3 \\ 0.3 & 0.5 & 0.2 \\ 0.2 & 0.3 & 0.5 \end{array} \right]$
观测概率矩阵：
$\left[ \begin{array}{ccc} 0.5 & 0.5 \\ 0.4 & 0.6 \\ 0.7 & 0.3 \end{array} \right]$
设 $T = 3$ ， $O = (红, 白, 红)$ ，试用前向算法计算 $P(O|\lambda)$ 。

前向算法计算：

第一个观测值是红，计算在初始概率分布下，三个状态观测到红的概率分别是：
$\alpha_1(1) = \pi_1 b_1(o_1) = 0.2 * 0.5 = 0.1 \\ \alpha_1(2) = \pi_2 b_2(o_1) = 0.4 * 0.4 = 0.16 \\ \alpha_1(3) = \pi_3 b_3(o_1) = 0.4 * 0.7 = 0.28$

$\\ P(第一个观测值是红，初始状态2) = P(第一个观测值是红|初始状态2) P(初始状态2) = P(观测值是红|状态2) P(初始状态2) \\ P(第一个观测值是红，初始状态3) = P(第一个观测值是红|初始状态3) P(初始状态3) = P(观测值是红|状态3) P(初始状态3)$

$\sum_{i=1}^3 P(第一个观测值是红，初始状态i) = 0.54$
在第一个观测值为红的前提下，转为状态1的概率：
$\beta_1(1) = \sum_{i=1}^3 \alpha_1(i) a_{i1} = 0.1 * 0.5 + 0.16 * 0.3 + 0.28 * 0.2 = 0.154$

$\begin{aligned} P(第一个观测值是红，第一个状态是1) &= \sum_{i=1}^3 P(第一个观测值是红|第一个状态是1) P(第一个状态是1|初始状态i) P(初始状态i) \\ &= \sum_{i=1}^3 P(第一个观测值是红|第一个状态是1) P(初始状态i) P(第一个状态是1|初始状态i) \\ &= \sum_{i=1}^3 P(观测值是红|状态1) P(初始状态i) P(下一个状态是1|状态i) \\ &= \sum_{i=1}^3 P(观测值是红, 初始状态i) P(下一个状态是1|状态i) \end{aligned}$

$P (第一个观测值是红，初始状态 i) P (第一个状态是 1 ∣ 初始状态 i) =$

在第一个观测值为红的前提下，转为状态2的概率：
$\beta_1(2) = \sum_{i=1}^3 \alpha_1(i) a_{i2} = 0.1 * 0.2 + 0.16 * 0.5 + 0.28 * 0.3 = 0.184$
在第一个观测值为红的前提下，转为状态3的概率：
$\beta_1(2) = \sum_{i=1}^3 \alpha_1(i) a_{i2} = 0.1 * 0.3 + 0.16 * 0.2 + 0.28 * 0.5 = 0.202$
所以
$\pi(1) = \left[ \begin{array}{cc} 0.154 & 0.184 & 0.202 \end{array} \right]^T$
第二个观测值为白，计算在上述概率分布下，三个状态观测到白的概率分别是：
$\alpha_2(1) = \beta_1(1) b_1(o_2) = 0.154 * 0.5 = 0.077 \\ \alpha_2(2) = \beta_1(2) b_2(o_2) = 0.184 * 0.6 = 0.1104 \\ \alpha_2(3) = \beta_1(3) b_3(o_2) = 0.202 * 0.3 = 0.0606$
在第一、二个观测值为红、白的前提下，转为状态1的概率：
$\beta_2(1) = \sum_{i=1}^3 \alpha_2(i) a_{i1} = 0.077 * 0.5 + 0.1104 * 0.3 + 0.0606 * 0.2 = 0.08374$
在第一、二个观测值为红、白的前提下，转为状态2的概率：
$\beta_2(2) = \sum_{i=1}^3 \alpha_2(i) a_{i2} = 0.077 * 0.2 + 0.1104 * 0.5 + 0.0606 * 0.3 = 0.08878$
在第一、二个观测值为红、白的前提下，转为状态3的概率：
$\beta_2(2) = \sum_{i=1}^3 \alpha_2(i) a_{i2} = 0.077 * 0.3 + 0.1104 * 0.2 + 0.0606 * 0.5 = 0.07548$
所以
$\pi(2) =\left[ \begin{array}{cc} 0.08374 & 0.08878 & 0.07548\end{array} \right]^T$
第三个观测值为红，计算在上述概率分布下，三个状态观测到红的概率分别是：
$\alpha_3(1) = \beta_2(1) b_1(o_1) = 0.08374 * 0.5 = 0.04187 \\ \alpha_3(2) = \beta_2(2) b_2(o_1) = 0.08878 * 0.4 = 0.03551 \\ \alpha_3(3) = \beta_2(3) b_3(o_1) = 0.07548 * 0.7 = 0.05284$