机器翻译(一):BLEU(bilingual evaluation understudy)

BLEU指标由IBM提出,用于评估机器翻译的质量,关注机器译文与参考译文的相似度。通过计算n-gram匹配度并结合brevity penalty(BP)调整短译文的得分,以更准确地反映翻译效果。
摘要由CSDN通过智能技术生成

简介

BLEU1(bilingual evaluation understudy)最早由IBM提出,用来评价翻译质量,该评价指标重点关注

相同文本下,机器与人翻译结果的近似程度

即机器译文与参考译文的相似程度。

算法

根据第一部分的介绍可知,BLEU可以评价机器译文与参考译文的相似度,但它是如何实现的呢?一种简单粗暴的方法是:统计同时出现在机器译文和参考译文中的词的个数,最后把匹配词的数目除以机器译文的单词数目,便是相似度。这种方法可以用如下公式表示:

P=mwt(1)

其中 m 表示能够在参考译文找到的机器译文词, wt 表示机器译文词的总数。为了便于理解,这里简单举一个例子

机器译文 the the the the the the the
参考译文 the cat is on the mat
参考译文 there is a cat on the mat

根据公式 (1) 可知,此时相似度为

P=77=1

此时相似度无法反应真实的翻译效果。显然, m 的计算方式是导致相似度失真的重要因素。为此,引入一种新的计算方式:

Countclip(word)=min
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值