应用HTK搭建连续语音识别系统(总结)

最新推荐文章于 2025-04-30 12:14:32 发布

原创

最新推荐文章于 2025-04-30 12:14:32 发布 · 9k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#工具 #bi #优化 #语言

本文详细介绍了如何运用HTK工具建立一个连续语音识别系统，包括数据准备、定义语法、创建声学模型、处理语料库、特征提取（如MFCC）、以及进行上下文无关和相关的模型训练。实验结果显示，最终的识别率为85.71%，表现出良好的性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一基于HMM的连续语音识别与HTK工具包介绍

语音识别系统的分类

被识别人：特定人非特定人

词汇量：小词汇量中词汇量大词汇量

说话方式：孤立词连接词连续词

语言：汉语英语法语…

我们做的非特定人大词汇量连续汉语语音识别系统

也叫汉语语音听写机

隐马尔可夫模型（Hidden Markov Model）

隐马尔可夫模型是马尔可夫链的一种，它的状态不能直接观察到，但能通过观测向量序列观察到每个观测向量都是通过某些概率密度分布表现为各种状态，每一个观测向量是由一个具有响应概率密度分布的状态序列产生。所以，隐马尔可夫模型是一个双重随机过程 ----具有一定状态数的隐马尔可夫链和显示随机函数集。

~o <VecSize> 39 <MFCC_0_D_A>

~h "proto"

<BeginHMM>

<NumStates> 5

<State> 2

<Mean> 39

0.0 …… 0.0

<Variance> 39

1.0 …… 1.0

<State> 3

<Mean&g

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。