基于HTK的连续语音识别系统搭建学习笔记（三）

最新推荐文章于 2019-07-16 18:06:55 发布

JamesJuZhang

最新推荐文章于 2019-07-16 18:06:55 发布

阅读量3.7k

点赞数

分类专栏： Speech Recognition 文章标签： HTK 连续语音识别

本文链接：https://blog.csdn.net/jojozhangju/article/details/18827789

版权

Speech Recognition 专栏收录该内容

29 篇文章 13 订阅

订阅专栏

[step 8]重校准训练数据

确认trainwords.mlf中的路径为"*/S0???.lab"，修改dict2加入silence sil一项，另存为dict3。

执行：

HVite -l * -o SWT -b silence -C .\config\config1 -a -H .\hmms\hmm7\macros -H .\hmms\hmm7\hmmdefs -i .\labels\aligned.mlf -m -t 350.0 -y lab -I .\labels\trainwords.mlf -S train.scp .\dict\dict3 .\lists\monophones1

生成文件：aligned.mlf（加入了sil）

生成位置：labels

注：HVite工具的详细介绍和使用参看HTK BOOK P316

重估两次：

HERest -C .\config\config1 -I .\labels\aligned.mlf -t 250.0 150.0 1000.0 -S train.scp -H .\hmms\hmm7\macros -H .\hmms\hmm7\hmmdefs -M .\hmms\hmm8 .\lists\monophones1

HERest -C .\config\config1 -I .\labels\aligned.mlf -t 250.0 150.0 1000.0 -S train.scp -H .\hmms\hmm8\macros -H .\hmms\hmm8\hmmdefs -M .\hmms\hmm9 .\lists\monophones1

我们再来看看这时的识别率怎么样：

HVite -H .\hmms\hmm9\macros -H .\hmms\hmm9\hmmdefs -S test.scp -l * -i .\results\recout_step8.mlf -w wdnet -p 0.0 -s 5.0 .\dict\dict2 .\lists\monophones1

HResults -I .\labels\testwords.mlf .\lists\monophones1 .\results\recout_step8.mlf

可以看出，识别结果比校准前有不小的提高。我们继续重估两次测试一下结果，看看会出现什么情况：

HERest -C .\config\config1 -I .\labels\aligned.mlf -t 250.0 150.0 1000.0 -S train.scp -H .\hmms\hmm9\macros -H .\hmms\hmm9\hmmdefs -M .\hmms\hmm9_1 .\lists\monophones1

HERest -C .\config\config1 -I .\labels\aligned.mlf -t 250.0 150.0 1000.0 -S train.scp -H .\hmms\hmm9_1\macros -H .\hmms\hmm9_1\hmmdefs -M .\hmms\hmm9_2 .\lists\monophones1

HVite -H .\hmms\hmm9\macros -H .\hmms\hmm9\hmmdefs -S test.scp -l * -i .\results\recout_step8_2.mlf -w wdnet -p 0.0 -s 5.0 .\dict\dict2 .\lists\monophones1

HResults -I .\labels\testwords.mlf .\lists\monophones1 .\results\recout_step8_2.mlf

识别效果：