基本上没有写博客的习惯,之前都是自己在Evernote上记笔记。看了很多牛人的博客,对自己的帮助很大,同时自己也经常忘记一些知识,因此在csdn上尝试记下笔记,希望能够帮助到其他人,也提醒自己一些过往的知识和内容。
HTK是语音识别的一个开源工具,能够帮助大家进行ASR的入门。关于安装已经有很多博客都已经写了,因此这里写一点其它的内容。
之前有同学对测试结果HResults的输出文本有些不理解。这里简单解释一下几个缩写名词。
词是分为正确率和准确率的。
正确率:只要和原来的标签相同就算正确。
准确率:除了要正确,还需要加上因为插入其它词造成的错误。
Percent Correct = ( N − D − S )
× 100%
/
N
Percent Accuracy = ( N− D− S−
I )
×
100% /
N
N-
total number of labels (总标签数)
D-
deletion
errors (删除错误)
S-
substitution errors (替换错误)
I-
insertion errors (插入错误)