语音识别系统之htk------孤立词识别(yesno)

本文详细介绍了如何使用HTK搭建孤立词语音识别系统,包括数据准备、特征提取、模型初始化、模型训练、建立语法规则和字典以及进行识别。通过录制和标注声音文件,提取MFCC特征,初始化和训练HMM模型,最终实现yes/no的识别。参考了多个资源并分享了安装过程。
摘要由CSDN通过智能技术生成

      孤立词的识别应该是最基础了,搭完htk的环境和安装好,首先就应该实验下。网上这方面的介绍也很多,大家可以去参考参考。下面就是整个过程:

一 数据准备

   说明:由于自己的linux操作系统不支持麦克风输入。所以在windows下准备数据。下午折腾了下,感觉比较麻烦。网上说需要安装oss,但是我的ubuntu版本似乎没找到对应的版本,我还是放弃了。这个是后话了。如果大家有什么更好的办法,可以告诉我。谢谢你……大家相互学习。

   首先,需要下个htk-3.3-windows-binary.zip。然后解压后,在这目录下运行

    HSLab name.sig

   这样就会出现录音和标注的图形界面。

1.1 录音

 Rec开始录音,按Stop结束。这样一个名字为name_0.sig的声音文件就被记录在当前目录了。如果你接着录音,name_1.sig就会被记录。SigHTK的格式。

1.2标注

   Mark后,出现第一个选择点A,然后再选择点B,这样你就选择好了要标注的段落,然后按Lableas键入名字,然后回车,比如第一个是sil,中间是yes或者no,最后是sil。我们的每段语音分成三部分,静音(sil), yes或者no, 静音(sil)。相邻的段不能重叠,可以有小的间隔。按Save加回车表示存储,会显示出你保存的名字。按Quit退出。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值