kaldi 详细安装教程、PyTorch-Kaldi、TIMIT下载、Librispeech下载

kaldi 详细安装教程

本kaldi 安装教程 转载于该链接kaldi 详细安装教程

安装系统依赖(如果经常使用linux 服务器,一般都会有)

apt-get update

apt-get install -y --no-install-recommends g++ make automake autoconf bzip2 unzip wget sox libtool git subersion python2.7 python3 zlib1g-dev gfortran ca-certificates patch vim
# 或
apt-get install -y  g++ make automake autoconf bzip2 unzip wget sox libtool git subersion python2.7 python3 zlib1g-dev gfortran ca-certificates patch vim

rm -rf /var/lib/apt/lists/*

ln -s /usr/bin/python2.7 /usr/bin/python

安装kaldi
首先先从github上直接克隆kaldi的仓库下来,网不好的话建议下载最新的压缩包然后直接解压。

git clone https://github.com/kaldi-asr/kaldi.git

检查依赖是否安装完成:

cd <kaldi-path>/tools
extras/check_dependencies.sh

这里它提示缺什么就再安装一遍。
然后自行下面的命令安装Intel MKL

extras/install_mkl.sh

不出意外的话这里应该是提示安装成功

使用以下命令检查依赖,

extras/check_dependencies.sh

如果提示
extras/check_dependencies.sh: all OK.
那依赖就没问题了。
之后运行

make -j 12
# 这里的12指的是cpu核心数,看自己的cpu设置,当然越多越快。

注意,此次也许不会提示任何错误,但是事实上有一些东西并没有安装成功,使用ls -lh 查看make过程中下载的4个***.tar.gz的大小,如果发现是0kb估计没下载成功,手动下载然后移动到当前目录下,然后使用make clean清空一下缓存就可以了重新make了。

编译Kaldi代码

# Config src before compiling
cd <kaldi-path>/src
./configure --shared 
# 我执行./configure --shared --use-cuda的时候提醒
# 我没有--use-cuda这个参数,我很奇怪,看了一下文件是有这个参数的,
# 但是默认为yes,所以这里不加--use-cuda应该也是行的通。


# Check depend and compile
make depend -j 12
make -j 12

当你经过上面漫长的make都没有出过任何错误时,那么恭喜你,你的kaldi大概率是安装完成了。

测试kaldi
运行yesno的例子,验证安装是否成功

cd <kaldi-path>/egs/yesno/s5

./run.sh
# 或 bash ./run.sh

如果完美运行就代表你以及成功安装完kaldi了!!!

PyTorch-Kaldi安装

安装PyTorch-Kaldi 官方的github上其实已经交代的很清楚了https://github.com/mravanelli/pytorch-kaldi
注意:Prerequisites
在安装PyTorch-Kaldi之前,安装Kaldi是预备条件,正如上面的部分,并且需要完成如下设置:

  • 打开终端,并输入以下命令来编辑 .bashrc 文件
nano ~/.bashrc
  • 在文件末尾添加以下内容
export KALDI_ROOT=/home/mirco/kaldi-trunk # 注意这里是你装kaldi的目录
PATH=$PATH:$KALDI_ROOT/tools/openfst
PATH=$PATH:$KALDI_ROOT/src/featbin
PATH=$PATH:$KALDI_ROOT/src/gmmbin
PATH=$PATH:$KALDI_ROOT/src/bin
PATH=$PATH:$KALDI_ROOT/src/nnetbin
export PATH
  • 保存并退出:
    在 nano 编辑器中,按下 Ctrl + X 键来退出。
    当提示是否保存更改时,按下 Y 键。
    然后按下 Enter 键确认保存更改。

  • 更新 .bashrc 文件:
    在终端中输入以下命令,使更改生效:

source ~/.bashrc

TIMIT下载

TIMIT 的官方下载链接是:https://catalog.ldc.upenn.edu/LDC93S1
对于学术工作来说,可以在https://academictorrents.com/免费下载
注意在https://academictorrents.com/下载时,需要下载Transmission torrent client
具体可以看 https://academictorrents.com/docs/downloading.html

Librispeech下载

Librispeech的下载非常简单:
https://www.openslr.org/12

语音处理相关的数据集下载

开源语音数据集

  • 19
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值