kaldi 声学模型构建dict过程

最新推荐文章于 2022-06-25 12:02:00 发布

quheDiegooo

最新推荐文章于 2022-06-25 12:02:00 发布

阅读量3.1k

点赞数 2

分类专栏：语音识别文章标签：声学模型 kaldi 训练语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/quheDiegooo/article/details/54948847

版权

语音识别专栏收录该内容

17 篇文章 7 订阅

订阅专栏

kaldi声学模型训练，首先需要数据准备，

在数据准备阶段需要准备标注数据的发音，处理步骤如下：

1.首先是把训练数据和测试数据对应的标注（text）合成一个文件到text_all，同时去掉其他非字母和数字的字符串

cat $traindatadir/text$testdatadir/text| perl -pe"s/^[\w\-]+\s+//">$dictdir/text_all

2.然后就是根据准备好的发音字典（sum_dict.processed.lex）对第一步的标注数据进行处理，得到sum_dict.lex 带声调

local/update_lex.pl -i ./conf/sum_dict.processed.lex-t$dictdir/text_all-o$dictdir/sum_dict.lex

3.最后，根据第二步骤生成的文件，来生成字典，音素等文件，放到字典文件夹下（$dictdir）

local/prepare_dict.sh $dictdir/sum_dict.lex$dictdir1

生成之后查看字典文件夹下面的文件，有如下文件：

1) words.txt 为训练数据和测试数据分词之后，和起来的所有去重之后的词

2) lexicon.txt 根据sum_dict.lex，生成word对应的发音字典文件，对应格式为 word phone phone phone...

3) silence_phones.txt 静音音素

4)optional_silence.txt 一个单独的音素，用来作为字典中默认的静音音素

5)phones.txt 根据lexicon生成的所有的音素集合

6)nonsilence_phones.txt 非静音音素

7)extra_questions.txt 用于构建决策树的问题集，由静音音素和非静音音素生成

还有sum_dict.lex text_all text_all_word

和lexiconp.txt 带概率的发音字典文件，格式为word prob phone phone phone...

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
kaldi 声学模型构建dict过程

kaldi声学模型训练，构建dict数据过程
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。