自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

James Zhang's Blog

Wave My Life.

  • 博客(14)
  • 收藏
  • 关注

原创 A Digit Recognizer——基于HTK实现数字串识别系统

这篇博文,可以说是之前学习笔记的实践,准备完成一个基于HTK实现数字串识别系统下面就让我们开始吧!由于很多部分的讲解在之前的博文中已经给出,所以这篇文章我们着重记录实验过程。整个系统分为四大部分,共有11步组成:(一)数据准备Step 1: The Task GrammarStep 2: The DictionaryStep 3: Recording the Data

2014-01-29 19:26:23 2943

原创 基于HTK的连续语音识别系统搭建学习笔记(四)

3.创建绑定状态的三音素HMM模型目的是加入上下文依赖(context-dependent)三音素模型并得到稳健的训练。包括两步,先由单音素得到三音素并重估参数,第二步就是绑定三音素的状态以使输出更加稳健。[step 9]得到三音素HMM上下文依赖三音素模型可以用单音素作为初始,再进行重估。由于重估时要三音素级标注文本,就先生成标注文本。创建文件:mktri.led创建位置:根

2014-01-28 02:34:01 3341

原创 基于HTK的连续语音识别系统搭建学习笔记(三)

[step 8]重校准训练数据确认trainwords.mlf中的路径为"*/S0???.lab",修改dict2加入silence sil一项,另存为dict3。执行:HVite -l * -o SWT -b silence -C .\config\config1 -a -H .\hmms\hmm7\macros -H .\hmms\hmm7\hmmdefs -i .\labels\

2014-01-28 01:09:51 3785 1

原创 基于HTK的连续语音识别系统搭建学习笔记(二)

[step 5]数据的特征提取这里所用特征为MFCC。工具HCopy可以实现提取特征的工作。创建文件夹:config创建文件:config1(要设置的参数)创建位置:config创建内容:创建文件:codetr.scp(制定训练输入和输出列表)创建位置:根目录下执行:HCopy -T 1 -C .\config\config1 -S codetr.scp

2014-01-28 00:02:20 5250 10

原创 基于HTK的连续语音识别系统搭建学习笔记(一)

放假之前,就已经对HTK上完成连续语音识别的实验充满兴趣。于是找了很多资料,准备在放假的时候好好学习,仔细琢磨,HTK博大精深,光学习和完成孤立词识别肯定是不够。从今天开始,开始同步学习和记录基于HTK的连续语音识别系统搭建工作,这一学习笔记主要记录学习过程,具体自己的实践后面会继续,本次学习的参考资料主要以:苏统华的《应用HTK搭建语音拨号系统》为主,同时,使用HTK BOOK作为参考。

2014-01-27 16:18:35 9564 4

原创 KALDI语音识别工具包运行TIMIT数据库实例

TIMIT数据库介绍:TIMIT数据库由630个话者组成,每个人讲10句,美式英语的8种主要方言。TIMIT S5实例:首先,将TIMIT.ISO中的TIMIT复制到主文件夹。1.进入对应的目录,进行如下操作:zhangju@ubuntu :~$ cd kaldi-trunk/egs/timit/s5/zhangju@ubuntu :~/kaldi-tr

2014-01-27 13:02:26 4896 1

原创 SPPAS自动对齐软件的介绍安装和使用

最近一直在自主学习连续语音识别的相关知识,也着手开始动手自己做一些列的实验。实验过程中需要采集自己需要的语料数据,但是发现采集之后标注确实是个问题,单纯使用praat逐个词的将音素也标注出来,实在是费时费力,所以经过这几天与同学的讨论和搜集资料,找到一个叫SPPAS的自动对齐标注软件,通过实验,基本满足我的需求,下面给大家介绍一下。SPPAS介绍:这个软件是法国人搞的,所以毋庸置疑

2014-01-27 12:07:52 6470 2

原创 声明

最近搬家CSDN,却发现博客搬家不支持原来的博客,所以将原来的博文细细检查,手动搬家。原博客地址:http://my.oschina.net/jamesju/blog现博客地址:http://blog.csdn.net/jojozhangju欢迎交流,转载请注明,谢谢。

2014-01-26 05:53:42 841

原创 KALDI语音识别库在LINUX下的安装和编译

1.介绍Kaldi语音识别工具将HTK比较零碎的各种各样的指令和功能进行整理集合,使用perl脚本调用。同时也加入了深度神经网络的分类器(DNN),本身由原来做HTK开发的人员制作而成,可以说是HTK的升级加强版。 kaldi官方网站请见:http://kaldi.sourceforge.net/index.html 2.安装和编译第一步:下载kaldi工具包 ka

2014-01-26 04:26:52 6259

原创 MyEclipse8.6以及Intellij IDEA运行CMU Sphinx中Helloworld DEMO实例

Section 1 MyEclipse 具体步骤如下:      File->new->project->java project找到workspaces中TestSphinxDemo文件,新建文件夹名为lib,并且加入如下jar包:在项目的src目录中新建名为edu.cmu.sphinx.demo.helloworld的包,并把原来的项目全部搞到包中:

2014-01-24 02:20:28 1988

原创 CMU SPHINX介绍

对于CMU Sphinx-4进行相关简单的介绍,并对其中的一些功能和使用进行相关说明。Introduction:CMU Sphinx:      由卡内基梅隆大学制作的用于语音识别的开源工具箱。CMU Sphinx-4:      Sphinx-4是完全用Java语言写的先进的语音识别系统。它是通过卡内基梅隆大学Sphinx组,Sun微系统实验室、三菱电器研

2014-01-24 02:05:21 3791

原创 使用HTK语音工具包进行孤立词识别基础教程

1.前言本教程主要介绍使用HTK工具包进行孤立词语音识别系统的搭建,主要参考书籍:HTK BOOK2.孤立词识别系统在本系统中我们将要实现三个词的识别系统,词汇集为:{brightness,channel,color}2.1.搭建步骤 A:创建语料库,brightness,channel,color各录制5次。B:声学分析,把wavform的声音文件转换为mfcc格

2014-01-24 01:57:14 4445 6

原创 HTK语音识别工具包的安装和编译

今天介绍一下HTK语音识别工具包的安装和编译,希望能够帮助到更多做语音相关工作的同仁们。介绍:HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做HiddenMarkov Toolkit。官方网站:http://htk.eng.cam.ac.uk Section 1 WINDOWS下HTK的安装和编译:第一步:下载官方

2014-01-23 22:18:55 7808 1

原创 语音特征参数MFCC提取过程详解

原来对语音特征参数MFCC的提取过程不是很了解,最近做实验需要自己手动去提取,所以借此机会,深入的学习了一下,所以记录下来,希望能够对日后的学习有一定的帮助。

2014-01-23 00:17:04 164959 26

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除