#系统环境
ubuntu 20.04 lts, 系统安装的python3默认为python3.8,我在海外的linode云主机测试的。
#安装环境:
sudo apt update
sudo apt-get install python3 cmake sox libsndfile1-dev ffmpeg flac -y
curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
python3 get-pip.py
git clone https://github.com/espnet/espnet
cd espnet/tools
./setup_python.sh $(command -v python3)
#fix bug on matplotlib
sudo apt-get install libfreetype6-dev -y
pip install torch==1.7.1 chainer==6.0.0 kaldiio espnet
make TH_VERSION=1.7.1 CPU_ONLY=0
#安装实用工具
apt install lrzsz pcp
在当前文件夹上传待测试的中文语音文件t.wav。代码中“kamo-naoyuki/aishell_conformer”为aishell数据集的预训练模型名(https://github.com/espnet/espnet_model_zoo/blob/master/espnet_model_zoo/table.csv 中可看到espnet model zoo中目前支持的预训练模型列表,中文asr目前就支持这一个)