语音识别系统kaldi----实例说明

最新推荐文章于 2022-08-12 17:35:57 发布

wbglearn

最新推荐文章于 2022-08-12 17:35:57 发布

阅读量3.8w

点赞数 5

分类专栏：语音

本文链接：https://blog.csdn.net/wbgxx333/article/details/17469947

版权

本文介绍了作者在使用kaldi进行语音识别系统实践的过程，包括yesno、rm、timit和voxforge等示例的步骤和遇到的挑战。作者强调了硬件条件和时间投入的重要性，并分享了kaldi论坛作为获取帮助的资源。同时，提供了相关博客链接以供进一步学习。

摘要由CSDN通过智能技术生成

最近一直在折腾kaldi，在这个庞大的系统面前，自己是那么的微小。由于数据库的原因，我只能运行kaldi所给例子的一部分。下面就来说说最近的进展吧。

第一个例子就是yesno这个例子。由于提供数据，而且数据比较小，可以非常容易的去实现这个例子。具体的可以见我之前的博客：语音识别工具箱之kaldi介绍。

第二个例子是rm里面的s4。具体的步骤也很简单，首先运行./getdata.sh，然后运行run.sh。贴下最后的结果：

        exp/tri2a/decode/wer_10:%WER 6.48 [ 368 / 5681, 47 ins, 91 del, 230 sub ]
        exp/tri2a/decode/wer_4:%WER 6.51 [ 370 / 5681, 88 ins, 47 del, 235 sub ]
        exp/tri2a/decode/wer_5:%WER 6.39 [ 363 / 5681, 79 ins, 53 del, 231 sub ]
        exp/tri2a/decode/wer_6:%WER 6.48 [ 368 / 5681, 73 ins, 62 del, 233 sub ]
        exp/tri2a/decode/wer_7:%WER 6.50 [ 369 / 5681, 68 ins, 66 del, 235 sub ]
        exp/tri2a/decode/wer_8:%WER 6.51 [ 370 / 5681, 60 ins, 76 del, 234 sub ]
        exp/tri2a/decode/wer_9:%WER 6.51 [ 370 /