![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Speech Recognition
文章平均质量分 78
JamesJuZhang
Researcher and Engineer.
Speech Production and Speech Synthesis.
展开
-
Ubuntu下安装CUDA 7.5教程——真正的简便
Ubuntu下安装CUDA 7.5教程——真正的简便原创 2016-05-24 00:36:17 · 6525 阅读 · 1 评论 -
语音合成技术新手区&KALDI语音识别新手区
公告为了方便语音合成、语音识别入门者相互交流、互相学习帮助,特建:语音合成技术交流新手群857378993KALDI语音识别新手群 279295537原创 2016-06-13 17:17:54 · 5266 阅读 · 0 评论 -
Kaldi语音识别工具运行TIMIT数据库实例
Kaldi语音识别工具运行TIMIT数据库实例原创 2016-05-18 18:12:03 · 5671 阅读 · 2 评论 -
语音特征参数MFCC提取过程详解
原来对语音特征参数MFCC的提取过程不是很了解,最近做实验需要自己手动去提取,所以借此机会,深入的学习了一下,所以记录下来,希望能够对日后的学习有一定的帮助。原创 2014-01-23 00:17:04 · 164403 阅读 · 26 评论 -
HTK语音识别工具包的安装和编译
今天介绍一下HTK语音识别工具包的安装和编译,希望能够帮助到更多做语音相关工作的同仁们。介绍:HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做HiddenMarkov Toolkit。官方网站:http://htk.eng.cam.ac.uk Section 1 WINDOWS下HTK的安装和编译:第一步:下载官方原创 2014-01-23 22:18:55 · 7751 阅读 · 1 评论 -
宾西法尼亚大学强制对齐标注软件(P2FA)介绍以及使用说明
介绍宾夕法尼亚大学语音标签强制对齐(Penn Phonetics Lab Forced Aligner , P2FA) 是基于 HTK 的自动语音标注工具包。它包括美式英语的声学模型,用来强制对齐的 python 文件以及 readme 文件和一些例子。原创 2016-07-19 01:30:09 · 7987 阅读 · 1 评论 -
KALDI学习笔记(一)——About the Kaldi project
最近一直在看KALDI官网的资料,在看的同时加一些注解,方便自己的理解。我的学习笔记基本上都是来自KALDI官方网址http://kaldi.sourceforge.net,并加上我的注解,特此说明。原创 2014-03-18 18:35:33 · 4313 阅读 · 0 评论 -
MyEclipse8.6以及Intellij IDEA运行CMU Sphinx中Helloworld DEMO实例
Section 1 MyEclipse 具体步骤如下: File->new->project->java project找到workspaces中TestSphinxDemo文件,新建文件夹名为lib,并且加入如下jar包:在项目的src目录中新建名为edu.cmu.sphinx.demo.helloworld的包,并把原来的项目全部搞到包中:原创 2014-01-24 02:20:28 · 1963 阅读 · 0 评论 -
使用HTK语音工具包进行孤立词识别基础教程
1.前言本教程主要介绍使用HTK工具包进行孤立词语音识别系统的搭建,主要参考书籍:HTK BOOK2.孤立词识别系统在本系统中我们将要实现三个词的识别系统,词汇集为:{brightness,channel,color}2.1.搭建步骤 A:创建语料库,brightness,channel,color各录制5次。B:声学分析,把wavform的声音文件转换为mfcc格原创 2014-01-24 01:57:14 · 4384 阅读 · 6 评论 -
CMU SPHINX介绍
对于CMU Sphinx-4进行相关简单的介绍,并对其中的一些功能和使用进行相关说明。Introduction:CMU Sphinx: 由卡内基梅隆大学制作的用于语音识别的开源工具箱。CMU Sphinx-4: Sphinx-4是完全用Java语言写的先进的语音识别系统。它是通过卡内基梅隆大学Sphinx组,Sun微系统实验室、三菱电器研原创 2014-01-24 02:05:21 · 3751 阅读 · 0 评论 -
KALDI学习笔记——Clustering mechanisms in Kaldi
KALDI学习笔记——Clustering mechanisms in Kaldi原创 2014-03-19 23:49:02 · 2984 阅读 · 0 评论 -
如何利用kaldi提自己想要的特征(mfcc plp pitch)
转自:http://blog.csdn.net/wbgxx333/article/details/27705939转载 2014-07-02 02:14:30 · 4478 阅读 · 0 评论 -
GMM-HMM语音识别模型 原理篇
本文简明讲述GMM-HMM在语音识别上的原理,建模和测试过程。这篇blog只回答三个问题:1. 什么是Hidden Markov Model?HMM要解决的三个问题:1) Likelihood2) Decoding3) Training2. GMM是神马?怎样用GMM求某一音素(phoneme)的概率?3. GMM+HMM大法解决语音转载 2015-04-18 02:59:57 · 7033 阅读 · 0 评论 -
KALDI学习笔记——The CUDA Matrix library
KALDI学习笔记——The CUDA Matrix library原创 2014-03-21 00:37:00 · 4340 阅读 · 0 评论 -
梅尔频率倒谱系数(MFCC)讲解
这几天搞一搞关于MFCC的东西,看到这篇文章非常好,所以转载下。转自:http://blog.csdn.net/zouxy09在任意一个Automatic speech recognition 系统中,第一步就是提取特征。换句话说,我们需要把音频信号中具有辨识性的成分提取出来,然后把其他的乱七八糟的信息扔掉,例如背景噪声啊,情绪啊等等。 搞清语音是怎么产生的对转载 2014-04-01 14:20:14 · 14532 阅读 · 1 评论 -
Kaldi学习笔记——The Kaldi Speech Recognition Toolkit(Kaldi语音识别工具箱)(上)
Kaldi学习笔记——The Kaldi Speech Recognition Toolkit(Kaldi语音识别工具箱)(上)原创 2014-04-01 20:47:24 · 9160 阅读 · 0 评论 -
Kaldi学习笔记——The Kaldi Speech Recognition Toolkit(Kaldi语音识别工具箱)(下)
Kaldi学习笔记——The Kaldi Speech Recognition Toolkit(Kaldi语音识别工具箱)(下)原创 2014-04-02 13:19:50 · 7747 阅读 · 0 评论 -
语音识别工具箱之kaldi----研究联盟
转自我的好朋友吴本谷的博客:http://blog.csdn.net/wbgxx333/article/details/17893641转载 2014-07-02 02:10:42 · 4057 阅读 · 3 评论 -
KALDI学习笔记——The build process (how Kaldi is compiled)
KALDI学习笔记——The build process (how Kaldi is compiled)原创 2014-03-19 01:06:06 · 3896 阅读 · 0 评论 -
根据标注区域提取需要部分的语音特征参数
根据标注区域提取需要部分的语音特征参数原创 2014-03-18 15:18:37 · 2689 阅读 · 2 评论 -
KALDI语音识别库在LINUX下的安装和编译
1.介绍Kaldi语音识别工具将HTK比较零碎的各种各样的指令和功能进行整理集合,使用perl脚本调用。同时也加入了深度神经网络的分类器(DNN),本身由原来做HTK开发的人员制作而成,可以说是HTK的升级加强版。 kaldi官方网站请见:http://kaldi.sourceforge.net/index.html 2.安装和编译第一步:下载kaldi工具包 ka原创 2014-01-26 04:26:52 · 6235 阅读 · 0 评论 -
SPPAS自动对齐软件的介绍安装和使用
最近一直在自主学习连续语音识别的相关知识,也着手开始动手自己做一些列的实验。实验过程中需要采集自己需要的语料数据,但是发现采集之后标注确实是个问题,单纯使用praat逐个词的将音素也标注出来,实在是费时费力,所以经过这几天与同学的讨论和搜集资料,找到一个叫SPPAS的自动对齐标注软件,通过实验,基本满足我的需求,下面给大家介绍一下。SPPAS介绍:这个软件是法国人搞的,所以毋庸置疑原创 2014-01-27 12:07:52 · 6404 阅读 · 2 评论 -
KALDI语音识别工具包运行TIMIT数据库实例
TIMIT数据库介绍:TIMIT数据库由630个话者组成,每个人讲10句,美式英语的8种主要方言。TIMIT S5实例:首先,将TIMIT.ISO中的TIMIT复制到主文件夹。1.进入对应的目录,进行如下操作:zhangju@ubuntu :~$ cd kaldi-trunk/egs/timit/s5/zhangju@ubuntu :~/kaldi-tr原创 2014-01-27 13:02:26 · 4867 阅读 · 1 评论 -
基于HTK的连续语音识别系统搭建学习笔记(一)
放假之前,就已经对HTK上完成连续语音识别的实验充满兴趣。于是找了很多资料,准备在放假的时候好好学习,仔细琢磨,HTK博大精深,光学习和完成孤立词识别肯定是不够。从今天开始,开始同步学习和记录基于HTK的连续语音识别系统搭建工作,这一学习笔记主要记录学习过程,具体自己的实践后面会继续,本次学习的参考资料主要以:苏统华的《应用HTK搭建语音拨号系统》为主,同时,使用HTK BOOK作为参考。原创 2014-01-27 16:18:35 · 9552 阅读 · 4 评论 -
基于HTK的连续语音识别系统搭建学习笔记(二)
[step 5]数据的特征提取这里所用特征为MFCC。工具HCopy可以实现提取特征的工作。创建文件夹:config创建文件:config1(要设置的参数)创建位置:config创建内容:创建文件:codetr.scp(制定训练输入和输出列表)创建位置:根目录下执行:HCopy -T 1 -C .\config\config1 -S codetr.scp原创 2014-01-28 00:02:20 · 5227 阅读 · 10 评论 -
基于HTK的连续语音识别系统搭建学习笔记(三)
[step 8]重校准训练数据确认trainwords.mlf中的路径为"*/S0???.lab",修改dict2加入silence sil一项,另存为dict3。执行:HVite -l * -o SWT -b silence -C .\config\config1 -a -H .\hmms\hmm7\macros -H .\hmms\hmm7\hmmdefs -i .\labels\原创 2014-01-28 01:09:51 · 3771 阅读 · 1 评论 -
基于HTK的连续语音识别系统搭建学习笔记(四)
3.创建绑定状态的三音素HMM模型目的是加入上下文依赖(context-dependent)三音素模型并得到稳健的训练。包括两步,先由单音素得到三音素并重估参数,第二步就是绑定三音素的状态以使输出更加稳健。[step 9]得到三音素HMM上下文依赖三音素模型可以用单音素作为初始,再进行重估。由于重估时要三音素级标注文本,就先生成标注文本。创建文件:mktri.led创建位置:根原创 2014-01-28 02:34:01 · 3321 阅读 · 0 评论 -
A Digit Recognizer——基于HTK实现数字串识别系统
这篇博文,可以说是之前学习笔记的实践,准备完成一个基于HTK实现数字串识别系统下面就让我们开始吧!由于很多部分的讲解在之前的博文中已经给出,所以这篇文章我们着重记录实验过程。整个系统分为四大部分,共有11步组成:(一)数据准备Step 1: The Task GrammarStep 2: The DictionaryStep 3: Recording the Data原创 2014-01-29 19:26:23 · 2915 阅读 · 0 评论 -
语音识别工具Kaldi环境配置及安装手册(更新加强版)
语音识别工具Kaldi环境配置及安装手册(更新加强版)原创 2016-05-05 22:21:32 · 17088 阅读 · 1 评论