Kaldi学习手记
文章平均质量分 78
by21010
这个作者很懒,什么都没留下…
展开
-
Kaldi学习手记(一):Kaldi的编译安装
Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。不过听学姐说以后还是在Linux下做开发多一些,我就想干脆顺便把Linux环境熟悉熟悉,于是就安了个虚拟机装上了Ubuntu。文档里面也说还是建议在Linux下使用Kaldi。好久没用过Linux了,也不习惯在命令行下操作,编译Kaldi还真是费了我一番功夫。下面把过程记录一下。原创 2015-10-12 13:57:14 · 28321 阅读 · 16 评论 -
Kaldi学习手记(二):Timit实例运行
Timit是LDC搜集的一个语料库,TIMIT语音库有着准确的音素标注,是一个学习用的好例子。在kaldi里面可以找到其语音识别的范例。但是由于这个数据库是商业用的,所以Kaldi里面并没有附带数据。但是数据又可以从网络上找到,so。。。。运行实例:首先进入timit/s5目录下,打开run.sh文件,找到以下内容:timit就是设置timit数据库的路径的原创 2015-11-24 11:23:06 · 4972 阅读 · 1 评论 -
语音关键词检索实验小结
语音关键词检索(KeywordsSearch),是指在连续语音流中检测出一组给定的关键词的过程。与大词汇量连续语音识别(Large Vocabulary Continuous Speech Recognition)相比,语音关键词检索不需要对非关键词的精确识别,只需要检测出关键词即可,降低了对语音识别系统的要求,拓展了系统的适用条件。语音关键词检索在实时对话系统,命令控制,语音拨号,语音监听,以及语音文档检索方面等方面有着广泛的应用。原创 2016-04-05 12:22:11 · 9564 阅读 · 7 评论 -
语音识别系统结构——鸟瞰
语音识别概述语音识别是指将语音信号转换为文字的过程。本文简略地介绍现在通行的语音识别系统框架。原创 2016-05-26 12:53:42 · 22803 阅读 · 7 评论 -
Kaldi学习手记(三): Kaldi 的I/O机制
本文概述了 Kaldi 中的 I/O 机制, 并简要分析了源代码。原创 2016-06-28 20:23:26 · 10096 阅读 · 0 评论