kaldi 详细安装教程
本kaldi 安装教程 转载于该链接kaldi 详细安装教程
安装系统依赖(如果经常使用linux 服务器,一般都会有)
apt-get update
apt-get install -y --no-install-recommends g++ make automake autoconf bzip2 unzip wget sox libtool git subersion python2.7 python3 zlib1g-dev gfortran ca-certificates patch vim
# 或
apt-get install -y g++ make automake autoconf bzip2 unzip wget sox libtool git subersion python2.7 python3 zlib1g-dev gfortran ca-certificates patch vim
rm -rf /var/lib/apt/lists/*
ln -s /usr/bin/python2.7 /usr/bin/python
安装kaldi
首先先从github上直接克隆kaldi的仓库下来,网不好的话建议下载最新的压缩包然后直接解压。
git clone https://github.com/kaldi-asr/kaldi.git
检查依赖是否安装完成:
cd <kaldi-path>/tools
extras/check_dependencies.sh
这里它提示缺什么就再安装一遍。
然后自行下面的命令安装Intel MKL
extras/install_mkl.sh
不出意外的话这里应该是提示安装成功
使用以下命令检查依赖,
extras/check_dependencies.sh
如果提示
extras/check_dependencies.sh: all OK.
那依赖就没问题了。
之后运行
make -j 12
# 这里的12指的是cpu核心数,看自己的cpu设置,当然越多越快。
注意,此次也许不会提示任何错误,但是事实上有一些东西并没有安装成功,使用ls -lh 查看make过程中下载的4个***.tar.gz的大小,如果发现是0kb估计没下载成功,手动下载然后移动到当前目录下,然后使用make clean清空一下缓存就可以了重新make了。
编译Kaldi代码
# Config src before compiling
cd <kaldi-path>/src
./configure --shared
# 我执行./configure --shared --use-cuda的时候提醒
# 我没有--use-cuda这个参数,我很奇怪,看了一下文件是有这个参数的,
# 但是默认为yes,所以这里不加--use-cuda应该也是行的通。
# Check depend and compile
make depend -j 12
make -j 12
当你经过上面漫长的make都没有出过任何错误时,那么恭喜你,你的kaldi大概率是安装完成了。
测试kaldi
运行yesno的例子,验证安装是否成功
cd <kaldi-path>/egs/yesno/s5
./run.sh
# 或 bash ./run.sh
如果完美运行就代表你以及成功安装完kaldi了!!!
PyTorch-Kaldi安装
安装PyTorch-Kaldi 官方的github上其实已经交代的很清楚了https://github.com/mravanelli/pytorch-kaldi
注意:Prerequisites
在安装PyTorch-Kaldi之前,安装Kaldi是预备条件,正如上面的部分,并且需要完成如下设置:
- 打开终端,并输入以下命令来编辑 .bashrc 文件
nano ~/.bashrc
- 在文件末尾添加以下内容
export KALDI_ROOT=/home/mirco/kaldi-trunk # 注意这里是你装kaldi的目录
PATH=$PATH:$KALDI_ROOT/tools/openfst
PATH=$PATH:$KALDI_ROOT/src/featbin
PATH=$PATH:$KALDI_ROOT/src/gmmbin
PATH=$PATH:$KALDI_ROOT/src/bin
PATH=$PATH:$KALDI_ROOT/src/nnetbin
export PATH
-
保存并退出:
在 nano 编辑器中,按下 Ctrl + X 键来退出。
当提示是否保存更改时,按下 Y 键。
然后按下 Enter 键确认保存更改。 -
更新 .bashrc 文件:
在终端中输入以下命令,使更改生效:
source ~/.bashrc
TIMIT下载
TIMIT 的官方下载链接是:https://catalog.ldc.upenn.edu/LDC93S1
对于学术工作来说,可以在https://academictorrents.com/免费下载
注意在https://academictorrents.com/下载时,需要下载Transmission torrent client
具体可以看 https://academictorrents.com/docs/downloading.html
Librispeech下载
Librispeech的下载非常简单:
https://www.openslr.org/12