一 基于 HMM 的连续语音识别与 HTK 工具包介绍
语音识别系统的分类
被识别人:特定人 非特定人
词汇量:小词汇量 中词汇量 大词汇量
说话方式:孤立词 连接词 连续词
语言:汉语 英语 法语…
我们做的非特定人大词汇量连续汉语语音识别系统
也叫 汉语语音听写机
隐马尔可夫模型( Hidden Markov Model )
隐马尔可夫模型是马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到每个 观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有响应概率密度分布的状态序列产生。所以,隐马尔可夫模型是一个双重随机过程 ----具有一定状态数的隐马尔可夫链和显示随机函数集。
~o <VecSize> 39 <MFCC_0_D_A>
~h "proto"
<BeginHMM>
<NumStates> 5
<State> 2
<Mean> 39
0.0 …… 0.0
<Variance> 39
1.0 …… 1.0
<State> 3
<Mean> 39
0.0 …… 0.0
<Variance> 39