整理一下训练新模型的过程:
1.进 入 到 kaldi-trunk/egs目录下创建XX(看你心情随便命名)文件夹,然后在文件夹里创建一个audio文件夹,在audio文件夹内在创建两个文件夹train和test。然后把所有的音频文件(.wav文件)放到train和test内(根据你的需求选择测试集和训练集,我是两个文件夹里面都是放的一样的)
2.在XX文件夹下面创建一个文件夹data,在data里面建立test和train文件夹。然后分别在文件夹里面构建以下几个文档:
1)spk2gender 这个文档表明说话人的性别
2)wav.scp
3)test
4)utt2spk
(注意,在train和test里面都要有这些文件)
3.在data文件夹下面创建另外一个文件夹local,在local文件夹创建一个文件corpus.txt
这几个文件的作用还有例子在百度搜索“在kaldi工具包使用小数字语料库创建一个简单的ASR系统”这篇文章可以看到,这里就不在赘述。我的这些文档是在windows下整理的,如果有时间,再整理一个文档来进行说明。
4.在local文件夹下创建一个新的文件夹‘dict’.在dict下创建文件:
1)lexicon.txt
2)nonsilence_phones.txt(你工程中所有的非静音因素)
3)silence_phones.txt(这里面是静音音素)
4)optional.txt
这几个文件的创建方法也在上面说的文章里面有介绍。1)2)两个需要按照你工程实际需要的音素表来写,需要自己生成音素表。
5.在 kaldi-tru
kaldi训练模型的过程
最新推荐文章于 2024-06-11 10:27:21 发布