HTK是Speech领域常用的一套工具,可以进行音频标注、特征提取以及HMM学习。
安装流程:
http://blog.csdn.net/yanli0823/article/details/8186382
我在Windows下安装好之后,想使用HSLab进行标注时曾经报错,原因是makefile文件中需要修改,参考:
http://blog.csdn.net/xiaoding133/article/details/6746953
一个Speech领域的经典例子:
read.pudn.com/downloads166/ebook/757854/HTK_basic_tutorial.pdf
除此以外,我自己的使用过程中不需要录音,而是下载了mp3来进行cheering和bell两种音频事件的分类。
写了个slides记录了一下自己的流程,主要就是修改了HSLab的输入格式。
另外,使用HCompv生成的vFloors时,要改写它的内容。可以直接把HMM的定义文件拷过来,里面的variance vector换成vFloors自己的就好。