机器学习：HMM：基础

最新推荐文章于 2019-10-29 00:14:22 发布

LandscapeMi

最新推荐文章于 2019-10-29 00:14:22 发布

阅读量445

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/mijian1207mijian/article/details/52070615

版权

机器学习专栏收录该内容

48 篇文章 0 订阅

订阅专栏

1. HMM的概念

时序概率模型，生产不可观测的状态序列和观测序列

定义

$\lambda = (A, B ,\pi)$

Q= 状态集合= $\{ q_1, q_2, ... ,q_N\}$ ……….N：状态数
V= 可能的观测集合= $\{v_1,v_2, ... , v_M\}$ ………. M：观测数
I=长度为T的状态序列= $（i_1,i_2,i_3,......,i_T）$
O=对应的观测序列= $(o_1,o_2, ...... ,o_T)$
A = 状态转移矩阵

$A=[a_{ij}]_{N*N}$

其中 $a_{ij}=P(i_{t+1}=q_j | i_t=q_i)$ ,,,,,,,,, i=1,…,N; j=1,….,N
t时刻处于状态 $q_i$ 的条件转移到t+1时刻状态q_j的概率
B= 观测概率矩阵

$B=[b_j(k)]_{N*M}$

其中 $b_j(k) = P(o_t=v_k | i_t=q_j) ........... k=1,2,3,...M; j=1,2......,N$
t时刻处于状态 $q_j$ 的条件下的观测 $v_k$ 的概率

$\pi$ 是初始状态概率向量：

$\pi = \pi(\pi_i)$

$t=1$ 时刻处于状态 $q_i$ 的概率

2. HMM的建模假设

齐次马尔科夫性假设

$P(i_t | i_{t-1},o_{t-1},......,i_1,o_1) = P(i_t|i_{t-1})$ ……….. $t=1,2,3,...,T$

观测独立假设

$P(o_t| i_T,o_T,....,i_1,o_i) = P(o_t|i_t)$

例子

P173

3. HMM模型的三个基本问题

概率计算问题：
给定模型 $\lambda = (A,B,\pi)$ 和观测序列 $O=(o_1,...,o_T)$ ,计算模型 $\lambda$ 下的观测序列 $O$ 出现的概率 $P(O|\lambda)$
学习问题：
已知观测序列 $O=(o_1,...,o_T)$ , 估计模型 $\lambda = (A,B,\pi)$ 的参数，使得在该模型下观测序列概率 $P(O|\lambda)$ ; 极大似然估计的方法
预测问题
已知模型 $\lambda = (A,B,\pi)$ 和观测序列 $O=(o_1,...,o_T)$ ;求给定观测序列条件概率 $P(I|O)$ 最大的状态序列 $I=(i_i,i_2, ... , i_T)$ ; 给定观测序列，求最可能的状态序列

4. 概率计算问题

已知： $\lambda = (A,B,\pi)$ 和观测序列 $O=(o_1,...,o_T)$ ,
求解： $\lambda$ 下的观测序列 $O$ 出现的概率 $P(O|\lambda)$

直接计算

状态序列 $I=\{i_1,i_2,...,i_T\}$ 的概率是

$P(I|\lambda) = \pi_{i_1}a_{i_1 i_2} a_{i_2 i_3} .... a_{i_{T-1} i_T}$
对于固定的状态序列 $I=\{i_1,i_2,...,i_T\}$ 下，观测序列 $O=(o_1, ... ,o_T)$ 的概率是 $P(O|I,\lambda)$

$P(O|I, \lambda) = b_{i_1}(o_1)b_{i_2}(o_2) ... b_{i_T}(o_T)$
O 和 I 的联合概率

$P(O|I,\lambda) = P(O|I,\lambda) P(I|\lambda)$
$=\pi_{i_1} b_{i_1}(o_1)a_{i_1 i_2} b_{i_2}(o_2)... a_{i_{T-1}}b_{i_T}(o_T)$
对所有的可能的状态序列 $I$ 求和, 得到观测序列 O的概率 $P(O|\lambda)$

$P(O|\lambda) = \sum \limits_I P(O|I,\lambda)P(I|\lambda)$
$=\sum \limits_{i_1,i_2,...,i_T} \pi_{i_1} b_{i_1}(o_1)a_{i_1 i_2} b_{i_2}(o_2)... a_{i_{T-1}}b_{i_T}(o_T)$
计算复杂度： $O(TN^T)$

5. 前向算法

前向概率

已知： $\lambda$
定义：时刻 $t$ 部分观测序列为 $o_1,o_2,...,o_t$ 且状态为 $q_i$ 的概率为前向概率

$\alpha_t(i) = P(o_1,o_2,...,o_t, i_t=q_i|\lambda)$

前向算法

输入：隐马尔科夫模型 $\lambda$ ；观测序列 $O$ ;
输出：观测序列的概率 $P(O|\lambda)$
1. 初值：
  
  $\alpha_1(i) = \pi_ib_i(o_i)$ ……… i=1,2,…,N
2. 递推： t=1,2,…,T-1
  
  $\alpha_{t+1}(i) = [\sum \limits_{j=1}^N \alpha_t(j) \alpha_{ji}]b_j(o_{t+1})$
3. 终止
  
  $p(O|\lambda) = \sum_{i=1}^N \alpha_T(i)$

结论

每次应用前一个时刻的计算结果

复杂度

$O(N^2T)$

6 .后向算法

前向概率

已知： $\lambda$
定义：时刻 $t$ 部分观测序列为 $o_1,o_2,...,o_t$ 且状态为 $q_i$ 的概率为前向概率

$\alpha_t(i) = P(o_1,o_2,...,o_t, i_t=q_i|\lambda)$

后向概率

已知： $\lambda$
定义：定义时刻 $t$ 下状态为 $q_i$ 条件下，从 $t+1$ 到 $T$ 部分观测序列为 $o_{t+1},o_{t+2},...,o_T$ 的概率是后向概率

$\beta_t(i) = P(o_{t+1},o_{t+2}, ... ,o_T| i_t = q_t ,\lambda)$

后向算法

输入：隐马尔科夫模型 $\lambda$ ；观测序列 $O$ ;
输出：观测序列的概率 $P(O|\lambda)$

步骤1：

$\beta_T(i)=1$ ……. i=1,2,…,N

步骤2：对于 $t= T-1,T-2,...,1$

$\beta_t(i) = \sum \limits_{j=1}^N a_{ij} b_j(o_{t+1})\beta_{t+1}(j)$ ……….. i=1, 2, 3, …, N

步骤3：

$P(O|\lambda) = \sum_{i=1}^N \pi_i b_i(o_i)\beta_i(i)$

7. HMM的概率与期望

* 给定 $\lambda$ 和观测 O，在 $t$ 时刻处于 $q_i$ 的概率

$\gamma_t(i) = P(i_t = q_i | O,\lambda)$

$\gamma_t(i) = P(i_t = q_i | O, \lambda) = \frac{P(i_t=q_i, O| \lambda)}{P(O| \lambda)}$

  因为：

$\alpha_t(i) \beta_t(i) = P(i_t = q_i ,O| \lambda)$

=>

$\gamma_i(t) = \frac{\alpha_t(i)\beta_t(i)}{P(O|\lambda)} = \frac{\alpha_t(i)\beta_t(i)}{\sum \limits_{j=1}^N {\alpha_t(i)\beta_t(j)}}$

* 给定模型 $\lambda$ 和观测 $O$ , 在时刻 $t$ 处于状态 $q_i$ 且在时刻 $t+1$ 处于 $q_j$ 的概率

$\xi_t(i ,j) = P(i_t=q_i,i_{t+1}=q_j | O,\lambda)$

前向后向概率计算 =>

$\xi_t(i ,j) =\frac{P(i_t=q_i, i_{t+1} = q_j, O | \lambda)}{P(O| \lambda)} =\frac{P(i_t=q_i, i_{t+1} = q_j, O | \lambda)}{\sum\limits _{i=1}^N \sum\limits_{j=1}^NP(i_t=q_i,i_{t+1}=q_j ,O |\lambda)}$
$= \frac{\alpha_t(i) a_{ij} b_j(O_{t+1})\beta_{t+1}(j)}{\sum\limits_{i=1}^N \sum\limits_{j=1}^N \alpha_t(i)a_{ij} b_j(o_{t+1}) \beta_{t+1}(j)}$