4.1 连续观测密度
目前为止我们的讨论中只考虑了观测是离散值的情况,这种情况下对每个状态可以使用离散概率密度。但是存在一些应用离散值是连续信号(比如向量)。虽然可以通过码本把连续信号量化,但是这种量化可能存在严重的退化。所以希望HMM中可以用连续观测密度。
为了使用连续观测密度,必须对模型概率密度函数(probability density function, pdf)进行约束以使得pdf的参数可以通过一致的方法进行估计。最一般的pdf的表示是如下的有限混合形式:
其中
O
是被建模的向量,
cjm
是在状态
j
的第
以使得pdf被正确归一化,即
(49)表示的pdf可以任意近地近似任一有限连续密度函数。所以可以用于解决很多问题。
混合密度系数的估计公式为
其中
′
表示向量转置,
γt(j,k) 在只有一个混合的时候泛化为(26)中的 γt(j) 。 aij 的估计表达式和离散观测密度时的一样((40b))。 cjk 的估计式是当使用第k个混合元素时系统在状态j的期望次数与系统在状态j的总期望次数的比例。类似地,均值向量 μ¯jk 的估计式是第k个混合元素对观测向量的贡献的期望比例。协方差矩阵 U¯jk 也有类似的解释。