孤立词的识别应该是最基础了,搭完htk的环境和安装好,首先就应该实验下。网上这方面的介绍也很多,大家可以去参考参考。下面就是整个过程:
一 数据准备
说明:由于自己的linux操作系统不支持麦克风输入。所以在windows下准备数据。下午折腾了下,感觉比较麻烦。网上说需要安装oss,但是我的ubuntu版本似乎没找到对应的版本,我还是放弃了。这个是后话了。如果大家有什么更好的办法,可以告诉我。谢谢你……大家相互学习。
首先,需要下个htk-3.3-windows-binary.zip。然后解压后,在这目录下运行
HSLab name.sig
这样就会出现录音和标注的图形界面。
1.1 录音
按Rec开始录音,按Stop结束。这样一个名字为name_0.sig的声音文件就被记录在当前目录了。如果你接着录音,name_1.sig就会被记录。Sig是HTK的格式。
1.2标注
按Mark后,出现第一个选择点A,然后再选择点B,这样你就选择好了要标注的段落,然后按Lableas键入名字,然后回车,比如第一个是sil,中间是yes或者no,最后是sil。我们的每段语音分成三部分,静音(sil), yes或者no, 静音(sil)。相邻的段不能重叠,可以有小的间隔。按Save加回车表示存储,会显示出你保存的名字。按Quit退出。