【kaldi】Kaldi tutorial翻译之Prerequisites(前提条件)-kaldi学习前必备梳理

翻译 2016年06月01日 11:52:52


本翻译仅供自己学习使用,不承担任何其他责任。水平有限拒绝转载。欢迎大家指出错误,共同学习。



我们假设本页的读者了解使用HMM-GMM进行语音识别的基础知识。在这里我们需要在线简明介绍的是:M. Gales and S. Young (2007).``The Application of Hidden Markov Models in Speech Recognition." Foundations and Trends in Signal Processing 1(3): 195-304. HTK教程也是一个非常好的资源。然而,除非你拥有很棒的数学底子而且非常专注于它,我们并不建议学习者冲破经典(outside an institutional setting.)进行语音识别学习。本页读者同时也是语音识别研究者,也可能是这个领域的毕业生或者进阶者。



我们假定你知道C++,至少熟悉一些shell脚本,最好使用bash或者相近的shell。本教程假定你正在使用UNIX相关环境或者Cygwin(虽然Kaldi不必完全匹配或者运行在所有的这些环境中)。


还有重要的是,本教程假定你能访问在Linguistic Data Consortium (LDC)中的Resource Management (RM) CDs中的原始分布式数据(in the original form as distributed)。我们假定你已经下载了这些数据并且同时获得了目录编号为LDC93S3A的数据。它被分为两个部分。请仔细一点,因为RM数据用不同的布局时预先会有一个不同的分布。


本系统的必要条件很简单。我们假定你拥有以下工具包(tools)包括wget, git, svn, awk, perl等等,或者你了解如何去安装它们。安装过程中最困难的部分主要跟math library ATLAS相关。如果你系统当中没有安装这个库,你需要去编辑它而且这过程中CPU throttling需要被关闭,这需要root权限。我们提供所有安装步骤的脚本和细节介绍。当脚本运行失败,请仔细阅读运行结果,可以为如何解决这个问题提供思路。如果在任何步骤有问题请联系我们,无论这个问题多么小,请参照 Other Kaldi-related resources (and how to get help)。


我们提供了一些关于本教程中每一步执行需要多久之类的信息。如果你只有很有限的时间去完成这个教程,一定要跳过以下步骤及不想链接到我们在文本中提供的那么多信息的话,我们还是建议你尽量遵守已经公布的时间表。这将会确保你能得到一个比较好的全局概览。你在之后的学习中需要复习更多数学中的细节。如果本教程用于教学,请把整个教程在相应环境下运行一遍,以此确保所有的先行条件都被安装。

---------------------------------------------------------------------------------------------------------

kaldi主页:http://kaldi-asr.org/doc/index.html

---------------------------------------------------------------------------------------------------------


相关文章推荐

KALDI学习笔记(一)——About the Kaldi project

最近一直在看KALDI官网的资料,在看的同时加一些注解,方便自己的理解。 我的学习笔记基本上都是来自KALDI官方网址http://kaldi.sourceforge.net,并加上我的注解,特此说明...

语音识别工具Kaldi环境配置及安装手册(更新加强版)

语音识别工具Kaldi环境配置及安装手册(更新加强版)

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

Kaldi学习手记(一):Kaldi的编译安装

Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。不过听学姐说以后还是在Linux下做开发多一些,我就想干脆顺便把Linux环境熟悉熟悉...
  • by21010
  • by21010
  • 2015年10月12日 13:57
  • 7325

Kaldi学习笔记——The Kaldi Speech Recognition Toolkit(Kaldi语音识别工具箱)(下)

Kaldi学习笔记——The Kaldi Speech Recognition Toolkit(Kaldi语音识别工具箱)(下)

kaldi常用工具(原理分析)

kaldi monophone 相关工具原理介绍

kaldi中的数据准备

数据准备 译者:V (shiwei@sz.pku.edu.cn)  水平有限,如有错误请多包涵。 介绍 在运行完示例脚本后(见Kaldi tutorial),你可能会想用自己的数据在Kaldi上...

kaldi上第一个免费的中文语音识别例子

今天在清华大学cslt实验室王东老师的分享下,kaldi终于有了免费的中文语音识别的例子,网址为:https://github.com/kaldi-asr/kaldi/tree/master/egs/...

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

Kaldi 入门详解

train_mono.sh 是音素训练脚本,下面详细介绍各个功能: 这部分是训练用参数,调用mono.sh时可以通过 –name value的方式改变这些参数. nj=4 并行个数 cm...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:【kaldi】Kaldi tutorial翻译之Prerequisites(前提条件)-kaldi学习前必备梳理
举报原因:
原因补充:

(最多只允许输入30个字)