第一部分总览:
一、混合高斯模型
1.相关数学基础和公式推导
2. 采用高斯混合分布对语音特征建模
GMM因其拟合任意复杂的、多种形式的分布能力,可以基于GMM的分类方法广泛应用于说话人识别、语音特征降噪与语音识别中。在语音特征降噪和噪声跟踪中,可以采用GMM拟合一个先验分布,在语音识别中GMM被整合在HMM中用于拟合基于状态的输出分布。使用GMM对HMM每个状态的语音特征分布进行建模有很多明显的优势,只要混合的高斯分布数目足够多,GMM可以拟合任意精度的概率分布,并且它可以通过EM算法很容易拟合数据。
GMM参数通过EM算法的优化,可以使其在训练数据上生成语音观察特征的概率最大化,在此基础上,若通过鉴别性训练,基于GMM-HMKM的语音识别系统的识别准确率可以得到显著提升。此外通过输入语音特征中加入由神经网络生成的联合特征和瓶颈特征,语音识别率同样可以得到提升。
但是! GMM不能有效的对呈非线性或近似非线性的数据进行建模。
第一部分 传统的声学模型(更新中)
最新推荐文章于 2022-06-23 17:23:17 发布