【kaldi】Kaldi tutorial翻译之Prerequisites(前提条件)-kaldi学习前必备梳理

翻译 2016年06月01日 11:52:52


本翻译仅供自己学习使用,不承担任何其他责任。水平有限拒绝转载。欢迎大家指出错误,共同学习。



我们假设本页的读者了解使用HMM-GMM进行语音识别的基础知识。在这里我们需要在线简明介绍的是:M. Gales and S. Young (2007).``The Application of Hidden Markov Models in Speech Recognition." Foundations and Trends in Signal Processing 1(3): 195-304. HTK教程也是一个非常好的资源。然而,除非你拥有很棒的数学底子而且非常专注于它,我们并不建议学习者冲破经典(outside an institutional setting.)进行语音识别学习。本页读者同时也是语音识别研究者,也可能是这个领域的毕业生或者进阶者。



我们假定你知道C++,至少熟悉一些shell脚本,最好使用bash或者相近的shell。本教程假定你正在使用UNIX相关环境或者Cygwin(虽然Kaldi不必完全匹配或者运行在所有的这些环境中)。


还有重要的是,本教程假定你能访问在Linguistic Data Consortium (LDC)中的Resource Management (RM) CDs中的原始分布式数据(in the original form as distributed)。我们假定你已经下载了这些数据并且同时获得了目录编号为LDC93S3A的数据。它被分为两个部分。请仔细一点,因为RM数据用不同的布局时预先会有一个不同的分布。


本系统的必要条件很简单。我们假定你拥有以下工具包(tools)包括wget, git, svn, awk, perl等等,或者你了解如何去安装它们。安装过程中最困难的部分主要跟math library ATLAS相关。如果你系统当中没有安装这个库,你需要去编辑它而且这过程中CPU throttling需要被关闭,这需要root权限。我们提供所有安装步骤的脚本和细节介绍。当脚本运行失败,请仔细阅读运行结果,可以为如何解决这个问题提供思路。如果在任何步骤有问题请联系我们,无论这个问题多么小,请参照 Other Kaldi-related resources (and how to get help)。


我们提供了一些关于本教程中每一步执行需要多久之类的信息。如果你只有很有限的时间去完成这个教程,一定要跳过以下步骤及不想链接到我们在文本中提供的那么多信息的话,我们还是建议你尽量遵守已经公布的时间表。这将会确保你能得到一个比较好的全局概览。你在之后的学习中需要复习更多数学中的细节。如果本教程用于教学,请把整个教程在相应环境下运行一遍,以此确保所有的先行条件都被安装。

---------------------------------------------------------------------------------------------------------

kaldi主页:http://kaldi-asr.org/doc/index.html

---------------------------------------------------------------------------------------------------------


语音识别工具Kaldi环境配置及安装手册(更新加强版)

语音识别工具Kaldi环境配置及安装手册(更新加强版)
  • u013538664
  • u013538664
  • 2016年05月05日 22:21
  • 5314

KALDI学习笔记(一)——About the Kaldi project

最近一直在看KALDI官网的资料,在看的同时加一些注解,方便自己的理解。 我的学习笔记基本上都是来自KALDI官方网址http://kaldi.sourceforge.net,并加上我的注解,特此说明...
  • u013538664
  • u013538664
  • 2014年03月18日 18:35
  • 3030

语音识别工具箱之kaldi介绍

最近有几个人在群里问我kaldi的问题,不巧的是最近我在忙我的开题。我对kaldi的了解也就是语音识别+深度学习。如果不是kaldi有dnn模型,或许我更愿意用htk吧。其实,基本的都差不多吧。kal...
  • u010384318
  • u010384318
  • 2013年12月04日 19:38
  • 17464

Kaldi学习笔记 -- 构建字典FST脚本 -- prepare_lang.sh 关键内容解析

摘要:本文介绍了Kaldi训练过程中数据准备部分 如何通过字典构造其FST模型。摘取其中较难理解的部分,此为自我见解,欢迎纠正。...
  • DuishengChen
  • DuishengChen
  • 2016年09月08日 18:06
  • 2295

Kaldi 中文语音识别需要考虑的问题

转自:点击打开链接 原文作者:英语流利说团队 李飞腾 Kaldi语音识别 1.声学建模单元的选择 1.1对声学建模单元加入位置信息 2.输入特征3.区分性技术4...
  • dearwind153
  • dearwind153
  • 2017年04月13日 09:40
  • 1909

Kaldi学习手记(一):Kaldi的编译安装

Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。不过听学姐说以后还是在Linux下做开发多一些,我就想干脆顺便把Linux环境熟悉熟悉...
  • by21010
  • by21010
  • 2015年10月12日 13:57
  • 8804

kaldi上使用gpu以及如何安装cuda

本博客是在@冒顿的指导下完成的。
  • u010384318
  • u010384318
  • 2014年11月17日 21:24
  • 6208

kaldi中的深度神经网络

这里是翻译kaldi主页的深度神经网络这部分,主要包括karel的版本和dan的版本,由于现在更新了新的版本,所以重新翻译。这些也将在kaldi的中文版本gitbook中发布,如果你想加入,你与我们取...
  • u010384318
  • u010384318
  • 2015年05月11日 10:35
  • 12092

kaldi中的特征提取

本翻译原文http://kaldi.sourceforge.net/feat.html,由@煮八戒翻译,@wbglearn校对和修改。   特征提取 简介 我们做特征提取和波形读取的这部分代码...
  • u010384318
  • u010384318
  • 2014年05月14日 10:36
  • 5113

kaldi中的数据准备

数据准备 译者:V (shiwei@sz.pku.edu.cn)  水平有限,如有错误请多包涵。 介绍 在运行完示例脚本后(见Kaldi tutorial),你可能会想用自己的数据在Kaldi上...
  • u010384318
  • u010384318
  • 2014年05月19日 12:24
  • 11852
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:【kaldi】Kaldi tutorial翻译之Prerequisites(前提条件)-kaldi学习前必备梳理
举报原因:
原因补充:

(最多只允许输入30个字)