Kaldi学习笔记(一)——Kaldi的下载安装与编译

Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。本次我是在虚拟机装上了Ubuntu 16.04.03,64位,可以联网。文档里面也说还是建议在Linux下使用Kaldi。

一、下载

下载直接利用git版本控制系统就可以了,打开终端,直接在你的实验目录下输入命令:

git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden

不一会就从github上下载下来了。当然,首先得确保你安装了git。要是没安装的话,就先输入:

sudo apt-get install git

安装git版本控制软件。

二、各目录功能

下载完毕以后,cd kaldi-trunk进去看看下载了一些什么东西。 

其中,./tools,./src和./egs这三个目录是比较重要的。

./tools目录下面全部都是Kaldi依赖的包。其中主要有:

  1. OpenFST:Weighted Finite State Transducer library,是一个用来构造有限状态自动机的库。我们知道隐马尔科夫模型就可以看成是一个有限状态自动机的。这是最终要的一个包,Kaldi的文档里面说:If you ever want to understand Kaldi deeply you will need to understand OpenFst.
  2. ATLAS:这是一个C++下的线性代数库。做机器学习自然是需要很多矩阵运算的。
  3. IRSTLM:这是一个统计语言模型的工具包。
  4. sph2pipe:这是宾夕法尼亚大学linguistic data consortium(LDC)开发的一款处理SPHERE_formatted数字音频文件的软件,它可以将LDC的sph格式的文件转换成其它格式。

./src目录存放的是Kaldi的源代码

./egs存放的是Kaldi提供的一些例子。我们现在要做的就是编译安装Kaldi依赖的各种库,然后编译安装Kaldi。

三、Kaldi的编译

安装之前需要确保你安装了这些软件:

apt-get
subversion
automake
autoconf
libtool
g++
zlib
libatal
wget

安装方法为在shell里输入:

sudo apt-get install subversion
sudo apt-get install automake
sudo apt-get install autoconf
sudo apt-get install libtool
sudo apt-get install g++
sudo apt-get install wget
sudo apt-get install libatlas-dev
sudo apt-get install libatlas-base-dev
sudo apt-get install zlib1g
sudo apt-get install zlib1g-dev 

1.在./tool目录下输入make,开始编译,输入make -j 4命令可以加快速度(多核并行处理)。 
2.之后切换到./src目录下,输入./configure进行配置,然后输入make all进行编译。当然这个过程也可以并行处理加速,输入make -j 4。经过漫长的编译过程以后,就安装完毕了。

©️2020 CSDN 皮肤主题: 终极编程指南 设计师:CSDN官方博客 返回首页