隐马尔可夫模型HMM整理

最新推荐文章于 2020-05-10 16:25:04 发布

吃龙虾一样能吃饱

最新推荐文章于 2020-05-10 16:25:04 发布

阅读量118

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_36013249/article/details/105766138

版权

9 篇文章 0 订阅

订阅专栏

周志华《机器学习》

1 概率图模型：描述随机过程的一个工具

每个结点的随机变量是可观测的；
给定一个随机序列： $S:s_1,s_2,s_3...s_T$ ，其联合概率分布为：
$P(s_1,s_2,s_3...s_T)=P(s_1)\cdot P(s_2|s_1)\cdot P(s_3|s_2)\cdot \cdot \cdot\cdot P(s_T|s_{T-1})$
其中的所有条件概率都可以在概率图模型中查到：

图片来源：https://zhuanlan.zhihu.com/p/46160757

每个节点的状态是不可观测（隐藏）的，但是每个节点的随机变量会生成一个观测变量，这个观测变量是可观测的。
状态变量（隐变量）： $\{y_1, y_2 , y_3 ,...,y_n \}, \quad y_i\in\mathcal{Y}=\{s_1, s_2 , s_3 ,...,s_N \}$ （状态空间）
观测变量： $\{x_1, x_2 , x_3 ,...,x_n \}, \quad x_i\in\mathcal{X}=\{o_1, o_2 , o_3 ,...,o_M \}$ （观测空间）

所有变量的联合概率分布为：
$P(y_1,y_2,y_3...y_n,x_1,x_2,x_3...x_n)=P(y_1) P(x_1|y_1)\prod_{i=2}^n P(y_i |y_{i-1})P(x_i|y_i)$
因此，要确定联合概率分布，需要的参数有以下3组：
- 状态转移概率：记为矩阵 $A=[a_{ij}]_{N\times N}$
  $a_{ij}=P(s_j|s_i), \quad i,j\in [1,N]$
- 输出观测概率：记为矩阵 $B=[b_{ij}]_{N\times M}$
  $b_{ij}=P(o_j|s_i), \quad i\in[1,N], j\in [1,M]$
- 初始状态概率：模型在初始时刻N个状态出现的概率，记为 $\pi=(\pi_1,\pi_2,...,\pi_N)$
  $\pi_i = P(y_1=s_i),\quad i\in[1,N]$
通过指定状态空间 $\mathcal{Y}$ 、观测空间 $\mathcal{X}$ 还有三组模型参数，就能确定一个马尔可夫模型；
可以用 $\lambda=[A,B,\pi]$ 来表示一个马尔可夫模型；

给定模型 $\lambda=[A,B,\pi]$ ，如何计算其产生观测序列 $x = \{x_1, x_2 , x_3 ,...,x_n \}$ 的概率 $P(x|\lambda)$ ?即如何评估模型与观测序列之间的匹配程度？
给定模型 $\lambda=[A,B,\pi]$ 和观测序列 $x = \{x_1, x_2 , x_3 ,...,x_n \}$ ，如何找到与此观测序列最匹配的状态序列 $y =\{y_1, y_2 , y_3 ,...,y_n \}$ ？即如何根据观测序列推断隐藏状态？
给定观测序列 $x = \{x_1, x_2 , x_3 ,...,x_n \}$ ，如何调整参数 $\lambda=[A,B,\pi]$ 使得该序列出现的概率 $P(x|\lambda)$ 最大？即如何训练模型使其能最好的描述观测数据？

预测推断：根据以往的观测序列 $x = \{x_1, x_2 , x_3 ,...,x_{n-1} \}$ 来推测当前时刻最有可能的观测值 $x_n$ ，可以转化为第一个问题；
语音识别：观测值为语音信号，隐藏状态为文字，根据观测序列来推断最有可能的状态序列，即对应的文字，可以转化为第二个问题；
模型拟合：根据样本（状态值和观测值），训练最优模型参数，使得其最好的拟合观测数据，可以转化为第三个问题；

团：对于图中结点的一个子集，若其中任意两结点之间都有边连接，则该子集成为一个“团”。若在一个团中加入任意一个其他结点都不再构成团，则该团称为“极大团”

马尔可夫随机场是生成式模型，因此对联合概率建模，MRF中，多个变量之间的联合概率分布能基于团分解为多个因子的乘积，也可以基于极大团来定义，假定所有极大团构成的集合为 $C^*$ ：
$P(x)=\frac{1}{Z^*}\prod_{Q\in C^*}\phi_Q(x_Q)$
$Z^*$ 为规范化因子， $\phi_Q(x_Q)$ 是定义在团 $x_Q$ 上的势函数；

关注

专栏目录