概念
隐马尔可夫模型(Hidden Markov Model,HMM)是一种用来描述两个联合时序序列分布 的概率模型。其中, 序列是外界可见的,称为观测序列; 序列是外界不可见的,称为状态序列。
主要特点和假设
马尔可夫假设:隐马尔可夫模型假设状态序列 满足马尔可夫性质,即当前状态的概率仅依赖于前一个状态。这种连续多个状态构成了隐马尔可夫链。
观测依赖状态:在任意时刻 ,观测 只依赖于该时刻的状态 ,与其他时刻的状态或观测无关。这体现了观测序列是由状态序列生成的。
模型要素
状态集(States):系统可能处于的所有状态的集合。假设状态集为
观测集(Observations):可以观测到的输出符号的集合。假设观测集为
初始状态概率分布(Initial State Distribution):在时间 时刻系统处于状态 的概率,记为,
状态转移概率矩阵(State Transition Probability Matrix):系统从状态转移到状态的概率,记为,其中,
观测概率矩阵(Observation Probability Matrix):在状态下生成观测的概率,记为,其中,,
确定了隐马尔可夫模型三元组,隐马尔可夫模型就确定了。
三个基本问题
概率计算问题(Evaluation Problem)
- 问题描述:给定参数和观测序列,计算在下观测序列出现的概率
- 解决方法:前向算法,通过递归计算每个时间步的前向概率,最终得到观测序列的概率
学习问题(Learning Problem)
- 问题描述:已知观测序列,估计模型的参数,使得在该模型下最大
- 解决方法:Baum-Welch算法
预测问题(Decoding Problem)
- 问题描述:给定参数和观测序列,求对给定观测序列条件概率最大的序列状态
- 解决方法:维特比算法通过动态规划的方法,找到使观测序列概率最大的状态序列