机器翻译的评价标准BLEU(Evaluation criteria for machine translation)

最新推荐文章于 2023-05-11 14:31:45 发布

u010105243

最新推荐文章于 2023-05-11 14:31:45 发布

阅读量5k

点赞数 4

分类专栏：自然语言处理

本文链接：https://blog.csdn.net/u010105243/article/details/78137897

版权

BLEU是一种用于自动评估机器翻译质量的标准，通过精确度来衡量翻译的相似性。它解决了n-gram出现次数不一致和翻译译文过短的问题，并引入了长度惩罚因子。BLEU计算涉及n-gram的加权几何平均，确保翻译的充分性和流畅性。

摘要由CSDN通过智能技术生成

1.概念

BLEU(bilingual evaluation understudy)在这篇论文中被提出BLEU: a Method for Automatic Evaluation of Machine Translation
BLEU是一种衡量机器翻译质量的评价标准。一种基于精确度的相似性度量方法，先看一下面的句子：

2.例子：n-gram在机器翻译译文和标准答案中出现次数不一致

机器翻译的句子：The the the the the the the.
标准的答案1：The cat is on the mat
标准的答案2：There is a cat on the mat
按照accuracy的计算方法：
P= $\frac{m}{w}=\frac{7}{7}=1$
其中m:机器翻译的句子中的单词在标准答案中的个数；w：机器翻译句子中单词的个数。机器翻译的每一个词语都在标准的答案中，accuracy=1，但是很明显这没有任何意义。
这里要解决的问题在于：机器翻译出的句子中同一个单词的出现个数>标准答案中同一个单词出现的个数,怎么办？