隐马尔可夫模型(hidden Markov model, HMM
)是可用于标注问题的统计学习模型,描述由隐藏的马尔可夫链随机生成观测序列的过程,属于生成模型.
一、定义
隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程.隐藏的马尔可夫链随机生成的状态的序列,称为状态序列(state sequence
);每个状态生成一个观测,而由此产生的观测的随机序列,称为观测序列(observation sequence
).序列的每一个位置又可以看作是一个时刻.
隐马尔可夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定
状态转移概率矩阵
A
与初始状态概率向量
确定了隐藏的马尔可夫链,生成不可观测的状态序列.观测概率矩阵 B
确定了如何从状态生成观测,与状态序列综合确定了如何产生观测序列.
例
10.1
(盒子和球模型)
假设有
4
个盒子,每个盒子里都装有红白两种颜色的球,盒子里的红白球数由表 10.1
列出.
要清晰前向概率的定义才能看懂后面的一系列解释,即在时刻t,观测序列和此时的状态都确定的概率。拿红白球例子来说,我在时刻t的时候是2号盒子,取出来的是红球的概率就是前向概率。
举个例子一切就很简单了:
- 第一步计算初值,分别算出来t=1时从盒子①拿出红球,从盒子②拿出红球,从盒子③拿出红球的概率;
- 第二步计算递推的值,先算出来t=2时从盒子①拿出白球,从盒子②拿出白球,从盒子③拿出白球的概率,以及t=3时从盒子①拿出红球,从盒子②拿出红球,从盒子③拿出红球的概率;
- 再将t=3得到的三个概率相加,可以得出最后观测序列O={红,白,红}的概率值。