- 博客(14)
- 收藏
- 关注
原创 A Digit Recognizer——基于HTK实现数字串识别系统
这篇博文,可以说是之前学习笔记的实践,准备完成一个基于HTK实现数字串识别系统下面就让我们开始吧!由于很多部分的讲解在之前的博文中已经给出,所以这篇文章我们着重记录实验过程。整个系统分为四大部分,共有11步组成:(一)数据准备Step 1: The Task GrammarStep 2: The DictionaryStep 3: Recording the Data
2014-01-29 19:26:23 2952
原创 基于HTK的连续语音识别系统搭建学习笔记(四)
3.创建绑定状态的三音素HMM模型目的是加入上下文依赖(context-dependent)三音素模型并得到稳健的训练。包括两步,先由单音素得到三音素并重估参数,第二步就是绑定三音素的状态以使输出更加稳健。[step 9]得到三音素HMM上下文依赖三音素模型可以用单音素作为初始,再进行重估。由于重估时要三音素级标注文本,就先生成标注文本。创建文件:mktri.led创建位置:根
2014-01-28 02:34:01 3348
原创 基于HTK的连续语音识别系统搭建学习笔记(三)
[step 8]重校准训练数据确认trainwords.mlf中的路径为"*/S0???.lab",修改dict2加入silence sil一项,另存为dict3。执行:HVite -l * -o SWT -b silence -C .\config\config1 -a -H .\hmms\hmm7\macros -H .\hmms\hmm7\hmmdefs -i .\labels\
2014-01-28 01:09:51 3791 1
原创 基于HTK的连续语音识别系统搭建学习笔记(二)
[step 5]数据的特征提取这里所用特征为MFCC。工具HCopy可以实现提取特征的工作。创建文件夹:config创建文件:config1(要设置的参数)创建位置:config创建内容:创建文件:codetr.scp(制定训练输入和输出列表)创建位置:根目录下执行:HCopy -T 1 -C .\config\config1 -S codetr.scp
2014-01-28 00:02:20 5258 10
原创 基于HTK的连续语音识别系统搭建学习笔记(一)
放假之前,就已经对HTK上完成连续语音识别的实验充满兴趣。于是找了很多资料,准备在放假的时候好好学习,仔细琢磨,HTK博大精深,光学习和完成孤立词识别肯定是不够。从今天开始,开始同步学习和记录基于HTK的连续语音识别系统搭建工作,这一学习笔记主要记录学习过程,具体自己的实践后面会继续,本次学习的参考资料主要以:苏统华的《应用HTK搭建语音拨号系统》为主,同时,使用HTK BOOK作为参考。
2014-01-27 16:18:35 9572 4
原创 KALDI语音识别工具包运行TIMIT数据库实例
TIMIT数据库介绍:TIMIT数据库由630个话者组成,每个人讲10句,美式英语的8种主要方言。TIMIT S5实例:首先,将TIMIT.ISO中的TIMIT复制到主文件夹。1.进入对应的目录,进行如下操作:zhangju@ubuntu :~$ cd kaldi-trunk/egs/timit/s5/zhangju@ubuntu :~/kaldi-tr
2014-01-27 13:02:26 4902 1
原创 SPPAS自动对齐软件的介绍安装和使用
最近一直在自主学习连续语音识别的相关知识,也着手开始动手自己做一些列的实验。实验过程中需要采集自己需要的语料数据,但是发现采集之后标注确实是个问题,单纯使用praat逐个词的将音素也标注出来,实在是费时费力,所以经过这几天与同学的讨论和搜集资料,找到一个叫SPPAS的自动对齐标注软件,通过实验,基本满足我的需求,下面给大家介绍一下。SPPAS介绍:这个软件是法国人搞的,所以毋庸置疑
2014-01-27 12:07:52 6487 2
原创 声明
最近搬家CSDN,却发现博客搬家不支持原来的博客,所以将原来的博文细细检查,手动搬家。原博客地址:http://my.oschina.net/jamesju/blog现博客地址:http://blog.csdn.net/jojozhangju欢迎交流,转载请注明,谢谢。
2014-01-26 05:53:42 845
原创 KALDI语音识别库在LINUX下的安装和编译
1.介绍Kaldi语音识别工具将HTK比较零碎的各种各样的指令和功能进行整理集合,使用perl脚本调用。同时也加入了深度神经网络的分类器(DNN),本身由原来做HTK开发的人员制作而成,可以说是HTK的升级加强版。 kaldi官方网站请见:http://kaldi.sourceforge.net/index.html 2.安装和编译第一步:下载kaldi工具包 ka
2014-01-26 04:26:52 6269
原创 MyEclipse8.6以及Intellij IDEA运行CMU Sphinx中Helloworld DEMO实例
Section 1 MyEclipse 具体步骤如下: File->new->project->java project找到workspaces中TestSphinxDemo文件,新建文件夹名为lib,并且加入如下jar包:在项目的src目录中新建名为edu.cmu.sphinx.demo.helloworld的包,并把原来的项目全部搞到包中:
2014-01-24 02:20:28 1994
原创 CMU SPHINX介绍
对于CMU Sphinx-4进行相关简单的介绍,并对其中的一些功能和使用进行相关说明。Introduction:CMU Sphinx: 由卡内基梅隆大学制作的用于语音识别的开源工具箱。CMU Sphinx-4: Sphinx-4是完全用Java语言写的先进的语音识别系统。它是通过卡内基梅隆大学Sphinx组,Sun微系统实验室、三菱电器研
2014-01-24 02:05:21 3807
原创 使用HTK语音工具包进行孤立词识别基础教程
1.前言本教程主要介绍使用HTK工具包进行孤立词语音识别系统的搭建,主要参考书籍:HTK BOOK2.孤立词识别系统在本系统中我们将要实现三个词的识别系统,词汇集为:{brightness,channel,color}2.1.搭建步骤 A:创建语料库,brightness,channel,color各录制5次。B:声学分析,把wavform的声音文件转换为mfcc格
2014-01-24 01:57:14 4462 6
原创 HTK语音识别工具包的安装和编译
今天介绍一下HTK语音识别工具包的安装和编译,希望能够帮助到更多做语音相关工作的同仁们。介绍:HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做HiddenMarkov Toolkit。官方网站:http://htk.eng.cam.ac.uk Section 1 WINDOWS下HTK的安装和编译:第一步:下载官方
2014-01-23 22:18:55 7823 1
原创 语音特征参数MFCC提取过程详解
原来对语音特征参数MFCC的提取过程不是很了解,最近做实验需要自己手动去提取,所以借此机会,深入的学习了一下,所以记录下来,希望能够对日后的学习有一定的帮助。
2014-01-23 00:17:04 165233 26
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人