【李航统计学习笔记】第十章：隐马尔科夫模型

西风瘦马1912

于 2022-08-15 05:27:34 发布

阅读量187

点赞数

分类专栏：李航统计学习笔记文章标签：机器学习统计学习隐马尔科夫模型

本文链接：https://blog.csdn.net/weixin_39236489/article/details/126339364

版权

李航统计学习笔记专栏收录该内容

11 篇文章 2 订阅

订阅专栏

10.1 隐马尔科夫模型

在这里插入图片描述

蓝色圆圈代表状态变量，绿色圆圈代表观测变量。

模型参数及符号：

状态集合： $Q=\left\{q_{1, \ldots} q_{N}\right\}$

预测集合： $V=\left\{v_{1, \ldots} v_{M}\right\}$

状态序列： $I=\left\{i_{1, \ldots} i_{T}\right\} \quad i_{\mathrm{t}} \subset Q$

预测序列 : $O=\left\{0_{1, \ldots} o_{T}\right\} \quad o_{\mathrm{t}} \subset$ $V$

然后我们可以构建状态转移矩阵
$\begin{array}{|c|c|c|c|c|c|} \hline & i_{2}=q_{1} & i_{2}=q_{2} & \ldots & i_{2}=q_{\mathrm{N}} & \\ \hline i_{1}=q_{1} & a_{11} & a_{12} & \ldots & a_{1 \mathrm{~N}} & a_{1 \mathrm{j}}=\mathrm{P}\left(i_{2}=q_{\mathrm{j}} \mid i_{1}=q_{1}\right) \\ \hline i_{1}=q_{2} & a_{21} & a_{22} & \ldots & a_{2 \mathrm{~N}} & a_{2 \mathrm{j}}=\mathrm{P}\left(i_{2}=q_{\mathrm{j}} \mid i_{1}=q_{2}\right) \\ \hline \ldots & \ldots & \ldots & \ldots & \ldots & \ldots \\ \hline i_{1}=q_{\mathrm{N}} & a_{\mathrm{N} 1} & a_{\mathrm{N} 2} & \ldots & a_{\mathrm{NN}} & a_{\mathrm{Nj}}=\mathrm{P}\left(i_{2}=q_{\mathrm{j}} \mid i_{1}=q_{\mathrm{N}}\right) \\ \hline \end{array}$
也就是
$A_{N \times N}=\left[\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 N} \\ a_{21} & a_{22} & \cdots & a_{2 N} \\ \cdots & \cdots & \cdots & \cdots \\ a_{N 1} & a_{N 2} & \cdots & a_{N N} \end{array}\right]$
然后我们构建观测概率矩阵
$\begin{array}{|c|c|c|c|c|} \hline & o_{1}=v_{1} & o_{1}=v_{2} & \ldots & o_{1}=v_{\mathrm{M}} \\ \hline i_{1}=q_{1} & b_{1}(1) & b_{1}(2) & \ldots & b_{1}(\mathrm{M}) \\ \hline i_{1}=q_{2} & b_{2}(1) & b_{2}(2) & \ldots & b_{2}(\mathrm{M}) \\ \hline \ldots & \ldots & \ldots & \ldots & \ldots \\ \hline i_{1}=q_{\mathrm{N}} & b_{\mathrm{N}}(1) & b_{\mathrm{N}}(2) & \ldots & b_{\mathrm{N}}(\mathrm{M}) \\ \hline \end{array}$

$B_{N \times M}=\left[\begin{array}{cccc} b_{11} & b_{12} & \cdots & b_{1 M} \\ b_{21} & b_{22} & \cdots & b_{2 M} \\ \cdots & \cdots & \cdots & \cdots \\ b_{N 1} & b_{N 2} & \cdots & b_{N M} \end{array}\right]$

我们设定初始状态概率向量为
$\pi=\left[\begin{array}{c} \pi_{1} \\ \pi_{2} \\ \cdots \\ \pi_{N} \end{array}\right]=\left[\begin{array}{c} P\left(i_{1}=q_{1}\right) \\ P\left(i_{2}=q_{2}\right) \\ \cdots\\ P\left(i_{N}=q_{N}\right) \end{array}\right]$
模型参数量是
$\lambda=\left(\pi_{N \times 1}, A_{N \times N}, B_{N \times M}\right)$
总参数量= $\times(N \times N) \times(N \times M)$ 。而自由参数量= $\times(N \times N-N) \times(N \times M-N)$ 。

在隐马尔科夫模型中，我们有两个基本假设:

齐次马尔科夫性: $P\left(i_{t} \mid i_{t-1}, \cdots, i_{1}\right)=P\left(i_{t} \mid i_{t-1}\right)$
观测独立假设

同时我们有三个基本问题：

概率计算问题： $\mid \lambda)$
学习问题: $\arg \max P(O \mid \lambda)$
预测问题: $\arg \max P(I \mid O)$

概率算法，计算 $\mid \lambda)$

1.直接计算法

$\mid \lambda)=\sum_{I} P(O \mid I, \lambda) P(I \mid \lambda)=\sum_{i_{1}, i_{2}, \ldots, i_T} \pi_{i_{1}} b_{i_{1}\left(o_{1}\right)} a_{i_{1} i_{2}} b_{i_{2}\left(o_{2}\right)} \ldots a_{i_{T-1} i_{T}} b_{i_{T}\left(o_{T}\right)}$

但是这个式子的计算复杂度为 $O(TN^T)$

2.前向计算法

计算复杂度为: $O\left(T N^{2}\right)$

引入新变量: $\alpha_{t}(i)=P\left(o_{1}, \cdots, o_{t}, i_{t}=q_{i} \mid \lambda\right), i=1, \ldots, N$

在这里插入图片描述

输入：隐马尔科夫模型 $\lambda$ , 观测序列 $O$

输出：观测序列概率 $\mid \lambda)$

步骤：

(1) 初值: $\alpha_{1}(i)=\pi_{i} b_{i}\left(o_{1}\right), i=1,2, \ldots, N$
(2) 递推: 对于 $\mathrm{t}=1,2, \ldots, T-1$
$\begin{gathered} \alpha_{t+1}(i)=P\left(O_{1}, \ldots, o_{t}, o_{t+1}, i_{t+1}=q_{i}\right) \\ =\sum_{j=1}^{N} P\left(O_{1}, \ldots, O_{t}, i_{t}=q_{i}\right) P\left(O_{t+1} \mid i_{t+1}=q_{i}\right) P\left(i_{t+1}=q_{i} \mid i_{t}=q_{j}\right) \\ =\left[\sum_{j=1}^{N} \alpha_{t}(j) a_{j i}\right] b_{i}\left(o_{t+1}\right) \end{gathered}$
(3) 终止：
$\mid \lambda)=\mathrm{P}\left(O_{1}, \ldots, O_{T} \mid \lambda\right)=\sum_{i=1}^{N} \mathrm{P}\left(O_{1}, \ldots, O_{T}, i_{T}=q_{i} \mid \lambda\right)=\sum_{i=1}^{N} \alpha_{T}(i)$
我们引入新变量 $\beta_{t}(i)=\mathrm{P}\left(o_{t+1}, \cdots, o_{T} \mid i_{t}=q_{i}, \lambda\right), i=1, \ldots, N$

在这里插入图片描述

3.后向算法

计算复杂度 $O(TN^2)$

输入：隐马尔科夫模型 $\lambda$ ,观测序列 $O$

输出：观测序列概率 $P(O\mid \lambda)$

步骤：

(1) 初值： $\beta_{T}(i)=1, i=1,2, \ldots, N$
(2) 递推：对t $\ldots, 1$
$\beta_{t}(i)=\sum_{j=1}^{N} a_{i j} b_{j}\left(o_{t+1}\right) \beta_{t+1}(j), i=1,2, \ldots, N$
(3) 终止： $P(O\mid\lambda)=\sum_{i=1}^{N} \pi_{i} b_{i}\left(o_{i}\right) \beta_{1}(i)$

学习算法，估计参数 $\lambda=(\pi, A, B)$

1.监督学习方法

已知训练数据包含 $S$ 个长度相同的观测序列和对应的状态序列 $\left\{\left(O_{1}, I_{1}\right),\left(O_{2}, I_{2}\right), \ldots,\left(O_{S}, I_{S}\right)\right\}$

(1)转移概率 $a_{i j}$ 的估计
$\hat{a}_{i j}=\frac{A_{i j}}{\sum_{j=1}^{N} A_{i j}}, i=1,2, \ldots, N ; j=1,2, \ldots, N$
(2)转移概率 $a_{i j}$ 的估计
$\widehat{b}_{j}(k)=\frac{B_{j k}}{\sum_{k=1}^{M} B_{j k}} j=1,2, \ldots, N ; k=1,2, \ldots, M$
(3)初始状态概率 $\pi_{i}$ 的估计 $\hat{\pi}_{i}$ 为 $S$ 个样本中初始状态为 $q_{i}$ 的频率

2.Buam-Welch算法（EM算法）

输入：观测数据 $O=\left(O_{1}, O_{2}, \ldots, O_{T}\right)$

输出：隐马尔科夫模型参数

(1)初始化：对 $n = 0$ ,选取 $a_{i j}^{(0)}, b_{j}(k)^{(0)}, \pi_{i}^{(0)}$ ,得到模型 $\lambda^{(0)}=\left(A^{(0)}, B^{(0)}, \pi^{(0)}\right)$

(2)递推：对 $\cdots,$
$a_{i j}^{(n+1)}=\frac{\sum_{t=1}^{T-1} \xi_{t}(i, j)}{\sum_{t=1}^{T-1} \gamma_{t}(i)}\\ b_{j}(k)^{(n+1)}=\frac{\sum_{t=1, o t=v k}^{T} \gamma_{t}(j)}{\sum_{t=1}^{T} \gamma_{t}(j)}\\ \pi_{i}^{(n+1)}=\gamma_{1}(i)$
其中
$\begin{gathered} \gamma_{t}(i)=\frac{\alpha_{t}(i) \beta_{t}(i)}{P(O \mid \lambda)}=\frac{\alpha_{t}(i) \beta_{t}(i)}{\sum_{j=1}^{N} \alpha_{t}(j) \beta_{t}(j)} \\ \xi_{t}(i, j)=\frac{\alpha_{t}(i) a_{i j} b_{j}\left(o_{t+1}\right) \beta_{t+1}(j)}{\sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_{t}(i) a_{i j} b_{j}\left(o_{t+1}\right) \beta_{t+1}(j)} \end{gathered}$

预测算法

目标：计算 $\arg \max P(I \mid O, \lambda)$

1.近似算法

$i_{t}^{*}=\arg \max _{1 \leq i \leq N}\left[\gamma_{t}(i)\right], t=1,2, \ldots, T$

其中 $\gamma_{t}(\mathrm{i})=P\left(i_{t}=q_{i} \mid O, \lambda\right)$

当 $t = 1$ :
$i_{1}^{*}=\arg \max _{1 \leq j \leq N} P\left(i_{1}=q_{j} \mid O, \lambda\right)=\arg \max _{1 \leq j \leq N}\left\{\begin{array}{c} P\left(i_{1}=q_{j} \mid O, \lambda\right) \\ \cdots\\ \left(i_{1}=q_{N} \mid O, \lambda\right) \end{array}\right\}$
当 $t = 2$
$i_{2}^{*}=\arg \max _{1 \leq j \leq N} P\left(i_{2}=q_{j} \mid O, \lambda\right)$
最后
$I^{*}=\left(i_{1}^{*}, \ldots, i_{T}^{*}\right)$

2.维特比算法

输入：模型 $\lambda=(A, B, \pi)$ 观测数据 $O=(o_1, o_2, \cdots, o_T)$

输出：最优路径 $I^{*}=\left(i_{1}^{*}, \ldots, i_{T}^{*}\right)$

(1)初始化
$\begin{gathered} \delta_{t}(i)=\pi_{i} b_{i}\left(o_{1}\right), i=1,2, \ldots, N \\ \Psi_{t}(i)=0, i=1,2, \ldots, N \end{gathered}$
(2)递推

对于 $\cdots, T$
$\begin{gathered} \delta_{t}(i)=\max _{1 \leq j \leq N}\left[\delta_{t-1}(j) a_{i j}\right] b_{i}\left(o_{t}\right), i=1,2, \ldots, N \\ \Psi_{t}(i)=\arg \max _{1 \leq j \leq N}\left[\delta_{t-1}(j) a_{i j}\right], i=1,2, \ldots, N \end{gathered}$
(3)终止
$\begin{gathered} P^{*}=\max _{1 \leq i \leq N} \delta_{T}(i) \\ i_{T}^{*}=\arg \max _{1 \leq i \leq N}\left[\delta_{T}(i)\right] \end{gathered}$
(4)最优路径回溯

对于 $\cdots, 1$
$i_{t}^{*}=\Psi_{t+1}\left(i_{t+1}^{*}\right)$
求得最优路径 $I^{*}=\left(i_{1}^{*}, i_{2}^{*}, \ldots, i_{T}^{*}\right)$

总结

状态链、观测链、状态转移矩阵、观测转移矩阵
隐马尔可夫两种假设：齐次马尔可夫性、观测独立假设
概率计算法：直接计算法、前向算法、后向算法
学习算法：EM算法
预测算法：近似算法、维特比算法

10.2 维特比算法(Viterbi Algorithm)

如上一节所示，我们在初始化中引入了新变量
$\delta_{t}(j)=\max _{i_{1}, i_{2}, \ldots, i_{t-1}} \mathrm{P}\left(i_{1}, \ldots, i_{t-1}, i_{t}=j, o_{t}, \ldots, o_{1} \mid \lambda\right), i=1,2, \ldots, N$
推导：
$\begin{aligned} \delta_{t+1}(i)&=\max _{i_{1}, i_{2}, \ldots, i t} P\left(i_{1}, \ldots, i_{t}, i_{t+1}=i, O_{t+1}, \ldots, o_{1} \mid \lambda\right) \\ &=\max _{1 \leq j \leq N} \delta_{t}(j) P\left(o_{t+1} \mid i_{t+1}=q_{i}\right) P\left(i_{t+1}=q_{i} \mid i_{t}=q_{j}\right) \\ &=\max _{1 \leq j \leq N}\left[\delta_{t}(j) a_{j i}\right] b_{i}\left(o_{t+1}\right) \quad i=1,2, \ldots, N; t=1,2, \ldots, T-1 \end{aligned}$
维特比算法本质是用动态规划来解决隐马尔科夫模型的预测问题

西风瘦马1912

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【李航统计学习笔记】第十章：隐马尔科夫模型

蓝色圆圈代表状态变量，绿色圆圈代表观测变量。模型参数及符号：状态集合： Q={q1,…qN}Q=\left\{q_{1, \ldots} q_{N}\right\}Q={q1,…qN}预测集合： V={v1,…vM}V=\left\{v_{1, \ldots} v_{M}\right\}V={v1,…vM}状态序列： I={i1,…iT}it⊂QI=\left\{i_{1, \ldots} i_{T}\right\} \quad i_{\mathrm{t}} \subset QI={i1,…iT
复制链接

扫一扫