2014年01月_JamesJuZhang

原创 A Digit Recognizer——基于HTK实现数字串识别系统

这篇博文，可以说是之前学习笔记的实践，准备完成一个基于HTK实现数字串识别系统下面就让我们开始吧！由于很多部分的讲解在之前的博文中已经给出，所以这篇文章我们着重记录实验过程。整个系统分为四大部分,共有11步组成：（一）数据准备Step 1: The Task GrammarStep 2: The DictionaryStep 3: Recording the Data

2014-01-29 19:26:23 2952

原创基于HTK的连续语音识别系统搭建学习笔记（四）

3.创建绑定状态的三音素HMM模型目的是加入上下文依赖（context-dependent）三音素模型并得到稳健的训练。包括两步，先由单音素得到三音素并重估参数，第二步就是绑定三音素的状态以使输出更加稳健。[step 9]得到三音素HMM上下文依赖三音素模型可以用单音素作为初始，再进行重估。由于重估时要三音素级标注文本，就先生成标注文本。创建文件：mktri.led创建位置：根

2014-01-28 02:34:01 3348

原创基于HTK的连续语音识别系统搭建学习笔记（三）

[step 8]重校准训练数据确认trainwords.mlf中的路径为"*/S0???.lab"，修改dict2加入silence sil一项，另存为dict3。执行：HVite -l * -o SWT -b silence -C .\config\config1 -a -H .\hmms\hmm7\macros -H .\hmms\hmm7\hmmdefs -i .\labels\

2014-01-28 01:09:51 3791 1

原创基于HTK的连续语音识别系统搭建学习笔记（二）

[step 5]数据的特征提取这里所用特征为MFCC。工具HCopy可以实现提取特征的工作。创建文件夹：config创建文件：config1（要设置的参数）创建位置：config创建内容：创建文件：codetr.scp（制定训练输入和输出列表）创建位置：根目录下执行：HCopy -T 1 -C .\config\config1 -S codetr.scp

2014-01-28 00:02:20 5258 10

原创基于HTK的连续语音识别系统搭建学习笔记（一）

放假之前，就已经对HTK上完成连续语音识别的实验充满兴趣。于是找了很多资料，准备在放假的时候好好学习，仔细琢磨，HTK博大精深，光学习和完成孤立词识别肯定是不够。从今天开始，开始同步学习和记录基于HTK的连续语音识别系统搭建工作，这一学习笔记主要记录学习过程，具体自己的实践后面会继续，本次学习的参考资料主要以：苏统华的《应用HTK搭建语音拨号系统》为主，同时，使用HTK BOOK作为参考。

2014-01-27 16:18:35 9572 4

原创 KALDI语音识别工具包运行TIMIT数据库实例

TIMIT数据库介绍：TIMIT数据库由630个话者组成，每个人讲10句，美式英语的8种主要方言。TIMIT S5实例：首先，将TIMIT.ISO中的TIMIT复制到主文件夹。1.进入对应的目录，进行如下操作：zhangju@ubuntu :~$ cd kaldi-trunk/egs/timit/s5/zhangju@ubuntu :~/kaldi-tr

2014-01-27 13:02:26 4902 1

原创 SPPAS自动对齐软件的介绍安装和使用

最近一直在自主学习连续语音识别的相关知识，也着手开始动手自己做一些列的实验。实验过程中需要采集自己需要的语料数据，但是发现采集之后标注确实是个问题，单纯使用praat逐个词的将音素也标注出来，实在是费时费力，所以经过这几天与同学的讨论和搜集资料，找到一个叫SPPAS的自动对齐标注软件，通过实验，基本满足我的需求，下面给大家介绍一下。SPPAS介绍：这个软件是法国人搞的，所以毋庸置疑

2014-01-27 12:07:52 6487 2

原创声明

最近搬家CSDN，却发现博客搬家不支持原来的博客，所以将原来的博文细细检查，手动搬家。原博客地址：http://my.oschina.net/jamesju/blog现博客地址：http://blog.csdn.net/jojozhangju欢迎交流，转载请注明，谢谢。

2014-01-26 05:53:42 845

原创 KALDI语音识别库在LINUX下的安装和编译

1.介绍Kaldi语音识别工具将HTK比较零碎的各种各样的指令和功能进行整理集合，使用perl脚本调用。同时也加入了深度神经网络的分类器(DNN)，本身由原来做HTK开发的人员制作而成，可以说是HTK的升级加强版。 kaldi官方网站请见：http://kaldi.sourceforge.net/index.html 2.安装和编译第一步：下载kaldi工具包 ka

2014-01-26 04:26:52 6269

原创 MyEclipse8.6以及Intellij IDEA运行CMU Sphinx中Helloworld DEMO实例

Section 1 MyEclipse 具体步骤如下： File->new->project->java project找到workspaces中TestSphinxDemo文件，新建文件夹名为lib，并且加入如下jar包：在项目的src目录中新建名为edu.cmu.sphinx.demo.helloworld的包，并把原来的项目全部搞到包中：

2014-01-24 02:20:28 1994

原创 CMU SPHINX介绍

对于CMU Sphinx-4进行相关简单的介绍，并对其中的一些功能和使用进行相关说明。Introduction：CMU Sphinx: 由卡内基梅隆大学制作的用于语音识别的开源工具箱。CMU Sphinx-4： Sphinx-4是完全用Java语言写的先进的语音识别系统。它是通过卡内基梅隆大学Sphinx组，Sun微系统实验室、三菱电器研

2014-01-24 02:05:21 3807

原创使用HTK语音工具包进行孤立词识别基础教程

1.前言本教程主要介绍使用HTK工具包进行孤立词语音识别系统的搭建，主要参考书籍：HTK BOOK2.孤立词识别系统在本系统中我们将要实现三个词的识别系统，词汇集为：{brightness,channel,color}2.1.搭建步骤 A：创建语料库，brightness,channel,color各录制5次。B：声学分析，把wavform的声音文件转换为mfcc格

2014-01-24 01:57:14 4462 6

原创 HTK语音识别工具包的安装和编译

今天介绍一下HTK语音识别工具包的安装和编译，希望能够帮助到更多做语音相关工作的同仁们。介绍：HTK是用来进行自动语音识别研究的工具包，它由剑桥大学工程系的机器智能实验室开发的开源软件，全称叫做HiddenMarkov Toolkit。官方网站：http://htk.eng.cam.ac.uk Section 1 WINDOWS下HTK的安装和编译：第一步：下载官方

2014-01-23 22:18:55 7823 1

原创语音特征参数MFCC提取过程详解

原来对语音特征参数MFCC的提取过程不是很了解，最近做实验需要自己手动去提取，所以借此机会，深入的学习了一下，所以记录下来，希望能够对日后的学习有一定的帮助。

2014-01-23 00:17:04 165233 26

James Zhang's Blog