HTK语音识别HResults的结果解释

版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/llearner/article/details/69389565

基本上没有写博客的习惯,之前都是自己在Evernote上记笔记。看了很多牛人的博客,对自己的帮助很大,同时自己也经常忘记一些知识,因此在csdn上尝试记下笔记,希望能够帮助到其他人,也提醒自己一些过往的知识和内容。


HTK是语音识别的一个开源工具,能够帮助大家进行ASR的入门。关于安装已经有很多博客都已经写了,因此这里写一点其它的内容。

之前有同学对测试结果HResults的输出文本有些不理解。这里简单解释一下几个缩写名词。


词是分为正确率和准确率的。

正确率:只要和原来的标签相同就算正确。

准确率:除了要正确,还需要加上因为插入其它词造成的错误。

Percent Correct = ( N − D − S )× 100%N
Percent Accuracy = ( N D S− I  )× 100% / N
N- total number of labels (总标签数)
D- deletion errors (删除错误)
S-  substitution errors (替换错误)
I-  insertion errors (插入错误)

展开阅读全文

没有更多推荐了,返回首页