kaldi LibriSpeech教程

最新推荐文章于 2024-08-13 22:49:09 发布

杨建利

最新推荐文章于 2024-08-13 22:49:09 发布

阅读量5.3k

点赞数 2

分类专栏： kaldi

本文链接：https://blog.csdn.net/hihei_set/article/details/99713228

版权

kaldi 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

因为我这里在服务器上下载数据很慢，所以，选择在别的地方下载好数据，然后上传过去的方式。稍微复杂一点。写个教程记录下.

1 下载训练数据 & 字典数据

data_url=www.openslr.org/resources/12 lm_url=www.openslr.org/resources/11

⚠️ data_url下的数据需要做解压，lm_url的数据不可以.

1 data_url的数据可以随便放，按照下面修改路径即可,另外，数据下载时下载

dev-clean test-clean dev-other test-other train-clean-100 即可

2 将im_url下载的数据拷贝到 egs/librispeech/s5/data/local/lm/ [没有目录就创建]

在该目录下执行:

ln -sf 3-gram.pruned.1e-7.arpa.gz lm_tgmed.arpa.gz ln -sf 3-gram.pruned.3e-7.arpa.gz lm_tgsmall.arpa.gz ln -sf 3-gram.arpa.gz lm_tglarge.arpa.gz ln -sf 4-gram.arpa.gz lm_fglarge.arpa.gz

2 修改egs/librispeech/s5/run.sh脚本

7 行: data=data_url下载下来解压好的地址[例如:xxx/LibriSpeech/xxx], data=xxx 13行: stage=2

3 执行run.sh

运行时间比较长，请注意。

4 测试模型

1 . 拷贝egs/voxforge/online_demo到egs/librispeech中

在egs/librispeech/online_demo下执行:

mkdir online-data mkdir work cd online-data mkdir audio mkdir models

2 拷贝模型

egs/librispeech/s5/exp

在该目录下寻找想要测试的模型，举例子:tri2b

cp -r final.mdl ../../../online_demo/online-data/models/tri2b cp -r final.mat ../../../online_demo/online-data/models/tri2b cp -r 35.mdl ../../../online_demo/online-data/models/tri2b cp -r words.txt ../../../../online_demo/online-data/models/tri2b cp -r HCLG.fst ../../../../online_demo/online-data/models/tri2b

1 final.mdl 模型文件

2 words.txt 字典

3 HCLH.fst 有限状态机

3 拷贝wav文件

随便找几首，放到audio中即可。

⚠️: 创建一个trans.txt,里面放着这个wav文件的名字

4 修改run.sh

16 行:ac_model_type= 修改为model名称，例如:tri2b 31-39行:注释掉 28行:trans_matrix=$ac_model/final.mat 87行:$ac_model=model 修改为$ac_model=final.mdl 88行:--acoustic-scale=0.0769 后面增加 --left-context=3 --right-context=3

5 执行即可