上文已经讲述的HMM的第一个问题,如何用前向后向算法求解观测序列的概率。本文讲述如何训练模型
一、HMM参数的训练有2种方法,一种是有监督学习,另一种是无监督学习。其中有监督学习很简单,无监督理解起来稍微困难。已知模型参数 λ=(αNN,βNM,πN)
- 有监督学习直接利用计数的方式来求得模型参数
- 假设已经给出训练数据包含S个长度相同的观测序列和对应的状态序列
(O1,I1),(O2,I2),...,(Os,Is)
,那么可以利用极大似然估计法来估计模型参数!!
- 转移概率的
αNN
估计。
αij=Aij÷∑Nj=1Aij
,A是个数
- 观测(发射)概率
βNM
的估计。
βj(k)=Bjk÷∑Mk=1Bjk
- 初始状态概率
πN
的估计。
πi=初始状态i发生的频率