在前面的笔记中,我们已经训练出thchs30模型。
这篇文章主要介绍如何用训练好的模型识别我们自己的语音。
一、安装portaudio
首先我们cd到tools下面,执行:./install_portaudio.sh
然后在cd到src下面,执行:make ext
二、创建相关文件
从voxforge把online_demo拷贝到thchs30下,和s5同级,online_demo建online-data和work两个文件夹。online-data下建audio和models,audio放要识别的wav,models建tri1,讲s5下/exp/下的tri1下的final.mdl和35.mdl拷贝过去,把s5下的exp下的tri1下的graph_word里面的words.txt和HCLG.fst也拷过去。(使用tri1训练出来的模型)
其中,final.mdl是训练出来的模型,words.txt是字典,和HCLG.fst是有限状态机。
三、修改脚本
打开online_demo的run.sh
a)将下面这段注释掉:(这段是vox