应用HTK搭建连续语音识别系统(总结)

本文详细介绍了如何运用HTK工具建立一个连续语音识别系统,包括数据准备、定义语法、创建声学模型、处理语料库、特征提取(如MFCC)、以及进行上下文无关和相关的模型训练。实验结果显示,最终的识别率为85.71%,表现出良好的性能。
摘要由CSDN通过智能技术生成

 

—一  基于 HMM 的连续语音识别与 HTK 工具包介绍
— 语音识别系统的分类

被识别人:特定人   非特定人

词汇量:小词汇量 中词汇量 大词汇量

说话方式:孤立词  连接词 连续词

语言:汉语  英语 法语…

 

我们做的非特定人大词汇量连续汉语语音识别系统

也叫 汉语语音听写机

 

 

— 隐马尔可夫模型( Hidden Markov Model )

    隐马尔可夫模型是马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到每个 观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有响应概率密度分布的状态序列产生。所以,隐马尔可夫模型是一个双重随机过程 ----具有一定状态数的隐马尔可夫链和显示随机函数集。

~o <VecSize> 39 <MFCC_0_D_A>

~h "proto"

<BeginHMM>

  <NumStates> 5

  <State> 2

    <Mean> 39

      0.0 …… 0.0

    <Variance> 39

      1.0 …… 1.0

 <State> 3

    <Mean> 39

      0.0 …… 0.0

    <Variance> 39

     

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值