高斯混合模型

最新推荐文章于 2024-07-16 17:56:45 发布

cug_coffee

最新推荐文章于 2024-07-16 17:56:45 发布

阅读量312

点赞数

分类专栏：语音识别

本文链接：https://blog.csdn.net/cug_coffee/article/details/104891995

版权

语音识别专栏收录该内容

7 篇文章 0 订阅

订阅专栏

高斯混合模型，首先说的那就是高斯分布，
$f(x)=\frac{1}{\sqrt{{2\pi}}\sigma}\exp(-\frac{(x-\mu)^2}{2\sigma^2})=N(x,\sigma,\mu^2)$
对应的均值方差是 $\mu$ ， $\sigma^2$
对于样本空间 $X$ ，有样本数据 $x=[x_1,x_2,x_3,x_4,...,x_n]$
高斯函数可以拟合任意的曲线，在样本是多维特征的情况下 $\vec{x}=[\vec{x_i}]$ 。
相应的就会有多元混合高斯分布。
多元的
$\sum_{m=1}^M{\frac{1}{\sqrt{{2\pi}}\sigma_m}\exp(-\frac{(x-\mu_m)^2}{2\sigma_m^2})}$
上面是单变量的混合高斯模型。
在现实生活中将单变量扩展到多变量就会有
$f(\vec{x}) = \sum_{m=1}^M{\frac{c_m}{{{2\pi}^{\frac{D}{2}}}{\vec{\sum{_m}}}^{\frac{1}{2}}} \exp(-{\frac{1}{2}}({\vec{x}-\vec{\mu_m}})^T{{\sum_m}^{-1}}({\vec{x}-\vec{\mu_m}}))} = \sum_{m=1}^M{{c_m}{N(\vec{x};\vec{\mu_m},\vec{\sum_m})}}$
参数估计问题，在多变量的高斯混合函数问题中，是用期望最大的方法来估计的，是一个迭代算法。
多变量的高斯混合函数能拟合任何函数。
在语音识别中，多变量的高斯混合函数，是以帧级别来估计每一帧的概率值；特征根据经验值来给定，一般就是特征的维度。
语音识别是一个语音信号序列识别的问题，gmm仅只是一个帧级别的模型；序列模型需要用隐马尔可夫模型来估计状态的序列问题；在状态上，可以用gmm模型来拟合当前状态的数据。