编辑距离与字符错误率CER

最新推荐文章于 2025-02-19 12:59:37 发布

warpin

最新推荐文章于 2025-02-19 12:59:37 发布

阅读量4.4k

点赞数 4

分类专栏：语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lhp171302512/article/details/123025064

版权

字符错误率编辑距离 LevenshteinDistance 语音识别 Python实现

关键词由CSDN通过智能技术生成

在语音识别场景中，字符错误率（Character Error Rate，CER）是衡量语音识别效果的一个重要指标。下文将介绍CER的原理，并且给出python实现的代码。

1 编辑距离

说到CER，不得不提的是编辑距离（Edit Distance），它是一个用来衡量两个序列的相似度指标。

假设有两个字符串（a和b），编辑距离是指把字符串a修改成b（或者把b改成a）需要的最少编辑次数。编辑的操作只能有三种：

插入（Insertion）
删除（Deletion）
替换（Substitution）

比如，把cat修改成cafe可以这样编辑：

cat --> caf（替换）
caf --> cafe（插入）

也可以这样编辑：

cat --> cate（插入）
cate --> cafe（替换）

1.1 原理

将两个字符串a和b的编辑距离表示为 $lev_{a,b}$ 。之所以用 $l e v$ ，是因为编辑距离的作者叫Levenshtein，所以编辑距离也叫Levenshtein Distance。

用 $lev_{a,b}(i,j)$ 表示字符串a的前i个字符与b的前j个字符间的编辑距离，比如， $lev_{cat,cafe}(2,3)$ 就表示ca与caf之间编辑距离。

Levenshtein Distance的思路就是，要计算字符串之间的距离，先计算子串间的距离，要计算子串间的距离，先计算子子串间的距离，如此分解下去。用数学语言表示，就是下面这个公式

$lev_{a,b}(i,j)=\begin{cases} max(i,j) & \text{ if } min(i,j)=0 \\ min\begin{cases} lev_{a,b}(i-1,j)+1 \\ lev_{a,b}(i,j-1)+1 \\ lev_{a,b}(i-1,j-1)+sign(a_i,b_j) \end{cases} & \text{ if } min(i,j)\neq0 \end{cases}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。