Kaldi+ESPnet安装指南

Kaldi+ESPnet安装指南

源码地址:kaldi-asr/kaldi: kaldi-asr/kaldi is the official location of the Kaldi project.(github.com)
espnet/espnet: End-to-End Speech Processing Toolkit (github.com)
官方安装文档:
http://kaldi-asr.org/doc/install.html
https://espnet.github.io/espnet/installation.html

服务器波动两次给环境和数据全整没了,第三次重新安装,给自己写个指南,万一还有下次(

0 环境准备

新建conda环境,在环境中安装好pytorch。

​ 根据espnet/egs2/librimix/sot_asr1(espnet/egs2/librimix/sot_asr1 at master · espnet/espnet (github.com))的README文件所示,他人复现环境版本信息如下:


在这里插入图片描述
目标安装python版本为3.8,pytorch版本为1.12.1。

conda create --name espnet python=3.8

conda activate espnet

pip install torch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1

等待下载任务完成后conda list查看已安装包列表:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2Oe34dJR-1689920516949)(C:\Users\谈莎莎\AppData\Roaming\Typora\typora-user-images\image-20230720163317595.png)]

接下来正式开始Kaldi工具的安装。

1 Kaldi安装

1.1 克隆Kaldi文件

进到目标文件夹下输入命令:

git clone https://github.com/kaldi-asr/kaldi.git

题外话:全新的服务器环境中没有git命令,于是企图安装git命令,输入命令报错发现没有sudo,遂安装sudo。命令如下:

apt-get install sudo
sudo apt-get install git

下载任务完成后可以看到目标文件夹中多出了kaldi文件夹。

1.2 tools编译

1.2.1 安装依赖包

首先进到kaldi/tools文件夹,根据官方文档,检查依赖包的安装情况:

extras/check_dependencies.sh

运行完成,显示缺少包:
在这里插入图片描述
直接复制它的命令进行安装:

sudo apt-get install g++ make automake autoconf patch sox gfortran libtool subversion python2.7

完成之后再回到上一条命令继续检查,发现遗漏:
在这里插入图片描述
继续复制命令安装:

sudo apt-get install zlib1g-dev

再再回到check,继续检查:
在这里插入图片描述
直接使用它给的命令安装:

extras/install_mkl.sh

安装完成后会提示successfully installed,再再再回到check:
在这里插入图片描述
提示all OK了,这一步完成。

1.2.2 编译

具体信息可以仔细查看官方安装文档,我直接:

make -j 8

等待编译完成。(-j *可选,配置高可多,低的话少一点否则会报错。)
在这里插入图片描述

1.3 src编译

确保上一步安装完成后回到kaldi目录下,进入src文件夹。

第一步:

./configure --shared

在这里插入图片描述
看到显示successfully configured,并提示下一步:

make depend -j 8

完成后再:

make -j 8

在这里插入图片描述
显示Done,完成。

1.4 验证是否安装成功

退回到kaldi目录下,进入egs文件夹,运行yesno实例:

cd egs/yesno/s5/
./run.sh

在这里插入图片描述
成功。

2 ESPnet安装

2.1 克隆Espnet文件

git clone https://github.com/espnet/espnet.git

2.2 安装依赖包

sudo apt-get install cmake
sudo apt-get install sox
sudo apt-get install flac

安装完成后连接到kaldi:

$ cd <espnet-root>/tools
$ ln -s <kaldi-root> .

2.3 设置Python环境

因为已经创建了conda环境,所以直接获取当前环境下的python:

./setup_python.sh $(command -v python3)

2.4 编译安装

在espnet/tools文件夹下直接:

make

2.5 验证安装是否成功

进入文件夹espnet/egs/yesno/asr1,运行:

./run.sh

在这里插入图片描述
成功。

小插曲:

  • 报错line 107: bc: command not found,没安装bc(Basic Calculator)包,直接

    sudo apt-get install bc
    
  • 报错run.pl: job failed, log is in exp/train_nodev_pytorch_train/train.log,看起来是torch出了问题,在log文件里找到AssertionError: Torch not compiled with CUDA enabled,conda list发现torch和torchaudio变成cpu版本的了,解决办法就是uninstall这两个cpu的包,再跟前面一样重新安装一下GPU版本的就行了:

    pip install torch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1
    
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
您可以按照以下步骤在CentOS上安装Kaldi: 1. 首先,确保您的CentOS系统已经安装了一些必需的软件包。使用以下命令更新系统并安装这些软件包: ``` sudo yum update sudo yum install -y wget git gcc-c++ make zlib-devel bzip2 ``` 2. 下载Kaldi源代码。您可以在Kaldi的GitHub页面上找到最新的源代码链接。使用wget命令下载源代码压缩包,然后解压缩它: ``` wget <kaldi-source-code-url> tar -xf kaldi-*.tar.gz ``` 3. 进入Kaldi源代码目录: ``` cd kaldi-* ``` 4. 执行configure脚本,该脚本将检查系统依赖项并生成Makefile: ``` ./configure ``` 5. 编译Kaldi。运行以下命令进行编译,可以根据需要添加-j参数以加快编译速度(其中N是您系统中可用的CPU核心数量): ``` make -jN ``` 6. 安装Kaldi。使用以下命令安装Kaldi到系统目录(需要管理员权限): ``` sudo make install ``` 7. 设置环境变量。编辑您的bash配置文件(如~/.bashrc或~/.bash_profile),添加以下行到文件末尾: ``` export KALDI_ROOT=/path/to/kaldi source $KALDI_ROOT/tools/env.sh ``` 然后运行以下命令使修改生效: ``` source ~/.bashrc ``` 现在,您已成功在CentOS上安装Kaldi。您可以继续配置和使用Kaldi来进行语音识别等任务。请注意,以上步骤只是一个基本的安装过程,可能会因您的系统环境和需求而有所不同。请参考Kaldi官方文档以获得更详细的安装和配置指南

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值