【NLP】BLEU值满分是100分吗？

最新推荐文章于 2024-06-06 16:30:29 发布

weixin_30861459

最新推荐文章于 2024-06-06 16:30:29 发布

阅读量2.7k

点赞数 3

文章标签：人工智能

原文链接：http://www.cnblogs.com/duye/p/10680058.html

版权

BLEU值是机器翻译评估的一种方法，基于参考翻译与实际翻译的n-gram匹配。最高分约为54.598，当实际翻译完全匹配参考翻译时取得。计算涉及单个单词到四元组的最大匹配次数，然后取指数平均得到最终分数。

摘要由CSDN通过智能技术生成

为了解决这个问题，首先需要知道BLEU值是如何计算出来的。
BLEU全称是Bilingual Evaulation Understudy。其意思是双语评估替补。所谓Understudy(替补)，意思是代替人进行翻译结果的评估。

BLEU的思想基于Count based Model，尽管它并不完美，但它提供了一种非常有效的以单一数字指标评估机器翻译结果的方法。

下面以一个例子说明BLEU的计算。

假如正确的翻译参考(2)个是：

The cat is on the desk.

There is a cat on the desk.

那么很自然想到，用实际翻译结果中出现在参考翻译中的单词数除以实际翻译结果单词总数，是一种评估方法。例如，若翻译结果为The cat are on the desk。则评分为：\(5/6\)，只有are没有出现，这看起来是合理的。但是若翻译结果为is is is is is is is，那么很显然，评分为\(6/6\)，is在参考翻译句子中出现了。很明显，这就不对了。

一个解决方法是，规定实际翻译结果中每个单词的计数不得超过在单个参考翻译中出现的最大次数。即上述is is is is is is结果，单词is在参考翻译中出现的最大次数是1，因此，评分为\(1/6\

最低0.47元/天解锁文章

weixin_30861459

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【NLP】BLEU值满分是100分吗？

为了解决这个问题，首先需要知道BLEU值是如何计算出来的。BLEU全称是Bilingual Evaulation Understudy。其意思是双语评估替补。所谓Understudy(替补)，意思是代替人进行翻译结果的评估。BLEU的思想基于Count based Model，尽管它并不完美，但它提供了一种非常有效的以单一数字指标评估机器翻译结果的方法。下面以一个例子说明BLEU的计算。假...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。