之前已经写过如何源码安装Kaldi,在此不再赘述,直奔主题!
- 准备数据
thchs30数据有两种,一种是HTK版,另一种就是Kaldi版。
Kaldi版下载地址
- 配置脚本
在Kaldi安装目录下,即/egs/thchs30/s5目录下修改脚本文件
(1)run.sh
第8行,修改n=20,此处根据自己的电脑cpu核数而定
第12行,修改thchs=/home/Michael/datasets/thchs30-openslr,此处根据自己语料数据所放位置而定,但需解压数据
(2)cmd.sh
修改如下:
export train_cmd=run.pl
export decode_cmd=run.pl
export mkgraph_cmd=run.pl
export cuda_cmd=run.pl
此处表示本地运行
- 模型训练
运行脚本
run.sh
对了,中间DNN模型部分需要GPU、CUDA,其安装方式请查看以前的博客。
最后,我的大概跑了一夜吧,反正第二天去看的时候已经跑完了。
运行结果s5/exp目录如下
模型测试结果so so ,online_demo的搭建过程在此就跳过了。