espnet是端到端语音识别开源框架,里面实现了很多端到端语音识别的方法。这里记录一下安装过程,便于以后换环境时能快速安装。
安装步骤
0.安装cmake
# Using anaconda (If you don't have sudo privilege, the installation from conda might be useful)
$ conda install cmake
1.安装pytorch
$ conda install pytorch==1.1.0 torchvision==0.3.0 cudatoolkit=10.0 -c pytorch
2.安装sox
$ sudo apt-get install sox
3.安装ffmpeg
$ sudo apt-get install ffmpeg
4.安装flac
$ sudo apt-get install flac
5.安装kaldi
已经安装,这一步不做记录。注意kaldi是必须安装的,espnet提取特征利用到kaldi。
6.安装espnet
$ git clone https://github.com/espnet/espnet
$ cd espnet
$ cd tools
指定cuda地址,如果不知道自己的cuda地址在哪的话用whereis cuda
命令能找到
CUDAROOT=/path/to/cuda
export PATH=$CUDAROOT/bin:$PATH
export LD_LIBRARY_PATH=$CUDAROOT/lib64:$LD_LIBRARY_PATH
export CFLAGS="-I$CUDAROOT/include $CFLAGS"
export CUDA_HOME=$CUDAROOT
export CUDA_PATH=$CUDAROOT
编译安装,需要指定kaldi的安装路径
$ make KALDI=/home/lcf/kaldi
7.检查是否安装完成
$ make check_install
如果正确安装的话会显示如下信息
完。