隐马尔可夫模型(HMM)
很多机器学习模型都有一个共同的假设:数据与数据之间是相互独立的,模型只关注当前数据的自变量与因变量之间的关系。
但是在现实生活中,会发现数据间的顺序对数据产生是有影响的。在学术上,具有这种特性的数据被称为序列数据。
隐马尔可夫模型(HMM) 则可以很好地观测这类数据,它是关于时序的概率模型,用有向图表示。
应用场景:在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中的成功应用,使它成为一种通用的统计工具。
一、概念
马尔可夫性质:当一个随机过程在给定现在状态及所有过去状态情况下,其未来状态的条件概率分布仅依赖于当前状态,也就是说当前时刻的状态只与上一时刻的状态有关。
马尔可夫链 :有马尔可夫性质且存在于离散的指数集和状态空间内的随机过程。
隐马尔科夫模型(HMM) 属于马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。
二、定义
隐马尔可夫模型(HMM) 可用五个元素描述,包括2个状态集合和3个概率矩阵:{ N, M, π,A,B }。一般的,可以用 λ=(A,B,π) 三元组来简洁的表示