kaldi训练模型的过程

最新推荐文章于 2024-06-11 10:27:21 发布

Championvas

最新推荐文章于 2024-06-11 10:27:21 发布

阅读量4.8k

点赞数 2

本文链接：https://blog.csdn.net/Championvas/article/details/81169785

版权

整理一下训练新模型的过程：
1.进入到 kaldi-trunk/egs目录下创建XX（看你心情随便命名）文件夹，然后在文件夹里创建一个audio文件夹，在audio文件夹内在创建两个文件夹train和test。然后把所有的音频文件（.wav文件）放到train和test内（根据你的需求选择测试集和训练集，我是两个文件夹里面都是放的一样的）
2.在XX文件夹下面创建一个文件夹data，在data里面建立test和train文件夹。然后分别在文件夹里面构建以下几个文档：
1）spk2gender 这个文档表明说话人的性别
2)wav.scp
3)test
4)utt2spk
（注意，在train和test里面都要有这些文件）
3.在data文件夹下面创建另外一个文件夹local，在local文件夹创建一个文件corpus.txt
这几个文件的作用还有例子在百度搜索“在kaldi工具包使用小数字语料库创建一个简单的ASR系统”这篇文章可以看到，这里就不在赘述。我的这些文档是在windows下整理的，如果有时间，再整理一个文档来进行说明。
4.在local文件夹下创建一个新的文件夹‘dict’.在dict下创建文件：
1）lexicon.txt
2）nonsilence_phones.txt(你工程中所有的非静音因素)
3）silence_phones.txt（这里面是静音音素）
4）optional.txt
这几个文件的创建方法也在上面说的文章里面有介绍。1)2）两个需要按照你工程实际需要的音素表来写，需要自己生成音素表。
5.在 kaldi-tru

最低0.47元/天解锁文章

Championvas

关注

2
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
kaldi训练模型的过程

整理一下训练新模型的过程：1.进入到 kaldi-trunk/egs目录下创建XX（看你心情随便命名）文件夹，然后在文件夹里创建一个audio文件夹，在audio文件夹内在创建两个文件夹train和test。然后把所有的音频文件（.wav文件）放到train和test内（根据你的需求选择测试集和训练集，我是两个文件夹里面都是放的一样的）2.在XX文件夹下面创建一个文件夹data，在data...
复制链接

扫一扫