使用kaldi进行语音自动切分、模型训练和强制对齐

这里,主要介绍一下网上的教程,经过一步步实验,对某些可能让人容易误解的地方进行注释。

1. 只有原始录音和音素标注,进行初次以及多轮的单音素、三音素模型训练,并且基于这些模型进行语音切分:

http://pages.jh.edu/~echodro1/tutorial/kaldi/kaldi-training.html

手工实验下来,只有两个地方略微不同。

1. 网上谈到要在lexicon.txt的顶部加入<oov> <oov>,然后在silence_phones.txt中加入oov。在初次进行训练时,他给的命令是: 

cd mycorpus
utils/prepare_lang.sh data/local/lang 'OOV' data/local/ data/lang

这里出错了,说OOV没有定义。
所以,实际上,在lexicon顶部要加入的是 oov oov,没
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值