WER(词错误率),SER(句错误率),CER(字错误率)
为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换(substitutions),删除(Deletions),或者插入(Insertions)某些词。
这些插入,替换,删除的词的总个数,除以标准的词序列中词的个数的百分比,即为WER,其计算公式如下所示:
注意:因为有插入词,所以WER有可能大于100%!
例:如下图所示,第一行为标准的词序列,第二行为识别出来的词序列
目标词序列中共有13个词,增加词3个,删除词1个,替换词6个,则WER:
SER:句子中如果有一个词识别错误,那么这个句子被认为识别错误,句子识别错误的的个数,除以总的句子个数即为SER。计算公式:
等等。