语音识别
金智慧
这个作者很懒,什么都没留下…
展开
-
HTK学习笔记(一)在win32(win7)下安装HTK详细体验教程
Step 1下载 HTK 和 HTK – samples 两个压缩文件,保存至D盘根目录下新建的HTK文件夹。下载地址:http://htk.eng.cam.ac.uk/download.shtml我下载的版本:3.4.1遇到问题:(1)HTK官方网站需要先注册(2)(chrome浏览器)注册后下载速度为0。解决办法:点“取消下载”,再点“重新下载”。转载 2016-05-11 17:52:02 · 2507 阅读 · 1 评论 -
HTK学习笔记(二)提取语音文件的mfcc特征
使用 HTK 的 HCopy 文件就可以完成提取 mfcc 特征的工作。1、需要准备内容如下:一个配置文件: XXX.conf一个输入输出文件:标明语音文件的地址 和 对应输出 mfcc 文件的地址注:以上两个文件要放在相同目录下2、给出配置文件:自命名为hcopy.conf ## Example of anacoustical analysis c转载 2016-05-11 17:57:07 · 5830 阅读 · 1 评论 -
基于HTK的连续语音识别系统搭建学习笔记(一)
该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性。当加入一个新名字时,只需修改发音字典和任务语法即可。模型为连续混合高斯输出,运用语音决策树聚类形成的绑定状态式三音素。1.数据准备需要录制训练数据和测试数据。为进行校准,还需要数据的标注文本。这里用任务语法(task grammar)产生真值文本(ground tru转载 2016-05-11 18:00:22 · 4447 阅读 · 7 评论 -
基于HTK的连续语音识别系统搭建学习笔记(二)
[step 5]数据的特征提取这里所用特征为MFCC。工具HCopy可以实现提取特征的工作。创建文件夹:config创建文件:config1(要设置的参数)创建位置:config创建内容:创建文件:codetr.scp(制定训练输入和输出列表)创建位置:根目录下执行:HCopy -T 1 -C .\config\config1 -S codetr.scp转载 2016-05-11 18:03:30 · 936 阅读 · 3 评论 -
基于HTK的连续语音识别系统搭建学习笔记(三)
[step 8]重校准训练数据确认trainwords.mlf中的路径为"*/S0???.lab",修改dict2加入silence sil一项,另存为dict3。执行:HVite -l * -o SWT -b silence -C .\config\config1 -a -H .\hmms\hmm7\macros -H .\hmms\hmm7\hmmdefs -i .\labels\转载 2016-05-11 18:04:45 · 739 阅读 · 0 评论 -
基于HTK的连续语音识别系统搭建学习笔记(四)
3.创建绑定状态的三音素HMM模型目的是加入上下文依赖(context-dependent)三音素模型并得到稳健的训练。包括两步,先由单音素得到三音素并重估参数,第二步就是绑定三音素的状态以使输出更加稳健。[step 9]得到三音素HMM上下文依赖三音素模型可以用单音素作为初始,再进行重估。由于重估时要三音素级标注文本,就先生成标注文本。创建文件:mktri.led创建位置:根转载 2016-05-11 18:06:09 · 1651 阅读 · 0 评论