语音识别ASR - HTK(HResults)计算字错率WER、句错率SER

最新推荐文章于 2024-07-14 00:48:05 发布

编程大乐趣

最新推荐文章于 2024-07-14 00:48:05 发布

阅读量2.8k

点赞数

本文介绍了ASR领域的关键指标——字错率(WER)和句错率(SER)，以及如何使用HResults工具进行计算。通过实例详细解析了HResults的使用方法，包括不同错误类型的计算，帮助理解这些指标在语音识别中的重要性。

摘要由CSDN通过智能技术生成

HResults计算字错率(WER)、句错率(SER)

前言

好久没发文，看到仍有这么多关注的小伙伴，觉得不发篇文对不住。确实好久没有输出经验总结相关的文档，抽了个时间，整理了下笔记，发一篇关于ASR常用测试指标。比如字错率、句错率指标，以及计算工具HResults的使用篇，后续慢慢找时间输出一些人工智能领域，小白可理解可用的基础知识，或者整理一些其他笔记发一发。

转载说明

本文为原创文章，如需转载，请在开篇显著位置注明作者Findyou和出处

一、基础概念

1.1、语音识别(ASR)

语音识别（speech recognition）技术，也被称为自动语音识别（英语：Automatic Speech Recognition, ASR），

狭隘一点白话说：将语音转换为文字的技术。

Findyou：一般使用ASR缩写。

1.2、句错率(SER)

句错误率：Sentence Error Rate

解释：句子识别错误的的个数，除以总的句子个数即为SER

计算公式：(所有公式省了 * 100%)

SER = 错误句数 / 总句数

1.3、句正确率(S.Corr）

句正确率：Sentence Correct

计算公式：

S.Corr = 1 - SER = 正确句数 / 总句数

1.4、字错率(WER/CER)

WER，Word error rate，词错率，但一般称为字错率，是语音识别领域的关键性评估指标，WER越低表示效果越好！

CER，Character Error Rate，字符错误率，中文一般用CER来表示字错率，原因请见1.4.3。

»1.4.1 、计算原理

字符串编辑距离（Levenshtein距离）算法

»1.4.2、计算公式(重要)

WER = (S + D + I ) / N =(S + D + I ) /(S + D + H )

（公式图片和文字一样，仅方便拷贝）

S 为替换的字数，常用缩写WS

D 为删除的字数，常用缩写WD

I 为插入的字数，常用缩写WI

H 为正确的字数，维基百科是C，但我统一改用H

N 为（S替换+ D删除+ H正确）的字数

Findyou：

1.正确的字数：维基百科里用的是C代表，H = N - (S+D) = C，我这边直接改成H，减少过多概念与变量。

2.大多数文章都没有给出N的计算方式，很容易误以为是原句总字数或者识别结果总字数。

3.不理解没关系，下面实例会帮助理解。

»1.4.3、问题

问题1：为什么WER会大于100%

因为有插入字(识别多出来的字)，所以理论上WER有可能大于100%，在下面实例我会举例（请见2.3.5），但实际场景，特别是大样本量的时候，基本太不可能出现。

问题2：说中文应该用CER，即“字符错误率”（Character Error Rate）

Findyou举个栗子：

英文：hello # 算一个Word

中文：你好 # 算两个字符

啰嗦文字解释，就是：

英文，因为最小单元是Word，语音识别应该用"字错误率"（WER），

中文，因为最小单元是字符，语音识别应该用“字符错误率”（CER）。

BUT(就是但是的意思...)，他跟我前面那一句一样，说的都是废话！

我们计算的时候谁不是按：中文的一个字符 = 英文的一个Word，那这样用WER的公式有什么问题呢？

谁再跟你咬文嚼字，怼他，使劲怼！

怼完，说回严谨的话，建议采用CER表示，哈哈哈哈哈......

1.5、字正确率(W.Corr）

字正确率，Word Correct，一般国内宣传用的多，识别率(识别正确率)达到多少多少(请见1.7)。

计算公式

W.Corr = ( N - D - S ) / N = H / N

问题：只计算了识别正确的字，没有管多出来的字（I插入），当然一般情况下不会有什么问题。

1.6、字准确率(W.Acc）

字准确率，Word Accuracy

计算公式

W.Acc = 1 - WER = ( N - D - S - I ) / N = (H - I) / N

（图片和文字一样，方便拷贝，W.Acc是Findyou自己用的简写）

特殊情况：当 I=0 时， W.Acc = W.Corr

问题：为什么W.Acc会是负

最低0.47元/天解锁文章

编程大乐趣

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

编程大乐趣 CSDN认证博客专家 CSDN认证企业博客

码龄12年

24: 原创

3万+: 周排名

180万+: 总排名

569万+: 访问

: 等级

1万+: 积分

2080: 粉丝

1758: 获赞

7: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

用python怎样做学生管理系统用类的形式-Python配置管理的几种方式
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客内容丰富，介绍了用python实现学生管理系统用类的形式和Python配置管理的几种方式。我觉得可以继续深入探讨Python配置管理的相关知识，比如如何使用配置文件、环境变量等方式来管理应用程序的配置信息。这样的技术文章对其他用户也会非常有帮助。下一篇博客建议可以写关于Python配置管理的具体实现方法和技巧，相信会有更多读者受益。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
15个PHP关于高并发的面试题（总结）
后端木木: 开刷撒
11个程序员最常犯的MySQL错误（PHP开发）
向彪-blockchain: 博主写的非常清晰，对我很有帮助，谢谢，方便可以互相关注。共同学习~方便的话可以加个关注。共同学习！一起进步！
2020年最新的PHP面试题（附答案）
向彪-blockchain: 写的挺不错的，继续加油哦！方便的话可以加个关注。共同学习！一起进步！
2020年，为什么你该学PHP？！！
向彪-blockchain: 比较简单，适合小白。方便的话可以加个关注。共同学习！一起进步！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。