kaldi 声学模型构建dict过程

kaldi声学模型训练,首先需要数据准备,

在数据准备阶段需要准备标注数据的发音,处理步骤如下:

1.首先是把训练数据和测试数据对应的标注(text)合成一个文件到text_all,同时去掉其他非字母和数字的字符串

  cat $traindatadir/text$testdatadir/text| perl -pe"s/^[\w\-]+\s+//">$dictdir/text_all

2.然后就是根据准备好的发音字典(sum_dict.processed.lex)对第一步的标注数据进行处理,得到sum_dict.lex 带声调

  local/update_lex.pl -i ./conf/sum_dict.processed.lex-t$dictdir/text_all-o$dictdir/sum_dict.lex

3.最后,根据第二步骤生成的文件,来生成字典,音素等文件,放到字典文件夹下($dictdir

    local/prepare_dict.sh $dictdir/sum_dict.lex$dictdir1

生成之后查看字典文件夹下面的文件,有如下文件:

1) words.txt   为训练数据和测试数据分词之后,和起来的所有去重之后的词

2) lexicon.txt  根据sum_dict.lex,生成word对应的发音字典文件,对应格式为 word phone phone phone...

3) silence_phones.txt  静音音素

4)optional_silence.txt  一个单独的音素,用来作为字典中默认的静音音素

5)phones.txt  根据lexicon生成的所有的音素集合

6)nonsilence_phones.txt  非静音音素

7)extra_questions.txt   用于构建决策树的问题集,由静音音素和非静音音素生成

还有sum_dict.lex  text_all  text_all_word 

和lexiconp.txt 带概率的发音字典文件,格式为word prob phone phone phone...



  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值