Kaldi系列--Ubuntu训练TIMIT数据集(二)

上一篇介绍了Kaldi的详细安装过程,本节在Ubuntu上训练TIMIT数据集。

TIMIT全称The DARPATIMIT Acoustic-Phonetic Continuous Speech Corpus, 是由德州仪器(TI)、麻省理工学院(MIT)和坦福研究院(SRI)合作构建的声学-音素连续语音语料库。TIMIT数据集的语音采样频率为16kHz,一共包含6300个句子,由来自美国八个主要方言地区的630个人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割,标记。70%的说话人是男性;大多数说话者是成年白人。

给定的10个句子中,包括:

-      2个方言句子(SA, dialect sentences),对于每个人这2个方言句子都是相同的;

-      5个音素紧凑句子(SX, phonetically compact sentences),这5个是从MIT所给的450个因素分布平衡的句子中选出,目的是为了尽可能的包含所有的音素对。

-      3个音素发散句子(SI, phonetically diverse sentences),这3个是由TI从已有的Brown 语料库(theBrown Coupus)和剧作家对话集(the Playwrights Dialog)中随机选择的,目的是为了增加句子类型和音素文本的多样性,使之尽可能的包括所有的音位变体(allophonic contexts)。


下面开始训练步骤:

1、在/egs/timit/s5文件夹下,创建data文件夹

2、解压TIMIT.zip到data文件夹,进入TIMIT文件夹,有文件包括:DOC, TEST, TRAIN三个文件夹和README.DOC文件;

3、修改/s5文件夹下的cmd.sh,因为是在本地虚拟机上跑的,所以代码修改为单机版,其它代码都注释掉,只保留下面4行(Ubuntu单机本地跑),命令为sudo gedit cmd.sh

export train_cmd=run.pl
export decode_cmd=run.pl
export cuda_cmd=run.pl
export mkgraph_cmd=run.pl

4、修改/s5文件夹下的run.sh,修改timit=开头的那行代码即可,该行代码是告诉程序我们下载好的语料库的位置在哪里,例如我修改后的代码如下,命令为sudo gedit run.sh
将         timit=/export/corpora5/LDC/LDC9351/timit/TIMIT # @JHU

修改为  timit=/kaldi-trunnk/egs/timit/s5/data/TIMIT

5、在/s5目录下,执行sudo ./run.sh

执行第5步的时候可以先看看/tools目录下有没有/irstlm文件夹,这是因为这个例程建立语言模型是用irstlm工具建立的。如果没有我们需要自己生成。进入kaldi目录下的tools/extras目录,执行./install_irstlm.sh脚本。安装完成以后,目录下出现irstlim目录。由于timit例程里面的引用irstlm工具的路径是tools目录,所以把这个目录拷贝到tools/目录下。回到egs/timit/s5目录,执行./run.sh脚本,于是timit例程就跑起来了。

6、/s5目录下可以打开RESULTS文件,这个文件有最近的运行结果

# Combination SGMM + Dans DNN:
---------------------------------Dev Set------------------------------------------
%WER 16.7 | 400 15057 | 86.0 10.9 3.1 2.7 16.7 99.5 | -0.102 | exp/combine_2/decode_dev_it1/score_6/ctm_39phn.filt.sys
%WER 16.7 | 400 15057 | 86.4 10.8 2.8 3.1 16.7 99.5 | -0.248 | exp/combine_2/decode_dev_it2/score_5/ctm_39phn.filt.sys
%WER 16.8 | 400 15057 | 85.8 10.9 3.3 2.6 16.8 99.3 | -0.013 | exp/combine_2/decode_dev_it3/score_7/ctm_39phn.filt.sys
%WER 16.9 | 400 15057 | 86.2 11.0 2.8 3.1 16.9 99.8 | -0.240 | exp/combine_2/decode_dev_it4/score_5/ctm_39phn.filt.sys
--------------------------------Test Set------------------------------------------
%WER 18.4 | 192 7215 | 84.6 12.0 3.5 3.0 18.4 99.0 | -0.223 | exp/combine_2/decode_test_it1/score_5/ctm_39phn.filt.sys
%WER 18.5 | 192 7215 | 84.5 12.1 3.4 3.0 18.5 99.0 | -0.215 | exp/combine_2/decode_test_it2/score_5/ctm_39phn.filt.sys
%WER 18.5 | 192 7215 | 84.4 12.0 3.7 2.9 18.5 99.0 | -0.074 | exp/combine_2/decode_test_it3/score_6/ctm_39phn.filt.sys
%WER 18.6 | 192 7215 | 84.9 12.0 3.1 3.6 18.6 99.0 | -0.451 | exp/combine_2/decode_test_it4/score_4/ctm_39phn.filt.sys


  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值