BLEU:Bilingual evaluation understudy

BLEU:Bilingual evaluation understudy

NMT/BLEU

N-gram

比较机翻和答案之间n组词的相似的一个占比

原文:今天天气不错
机翻:It is a nice day today
答案:Today is a nice day

1-gram:

1457484-20180808132157198-106484777.png

机翻一共6个词 5个都命中
1-gram precision 5/6

3-gram:

1457484-20180808132148124-1458168815.png

机翻一共可以分为四个3-gram的词组 其中两个可以命中答案
3-gram precision 2/4

一词类推可以计算到N-gram的precision
一般来说,1-gram的结果代表了有多少个词被单独翻译出来了,反映了翻译的充分性。2-gram以上的结果反映了译文的流畅度,越高翻译可读性高。

Precison and Modified n-gram precision

机翻: the the the the the the the.

答案 1: The cat is on the mat.

答案 2: There is a cat on the mat.

1457484-20180808132125134-1964879102.png

每一个句子都可以得到一个Modified n-gram precision,一个句子不能代表文本翻译的水平高低,于是把一段话或者所有翻译句子的结果综合起来:

1457484-20180808132114365-1221866512.png

(将候选段落的所有n-gram进行了截断统计作为分子,分母是候选段落的n-gram的个数)

比如说Modified 1-gram precision就分母是机翻答案有多少个单词。
然后分子是 所有不重复单词求COUNTclip然后加起来。

多个modified n-gram precision进行组合

unigram和n-gram下的指标进行组合使用
1457484-20180808132059055-1509685119.png

随着n-gram的增大,Precision总体上成指数下降的,而且可以粗略的看成随着n而指数级的下降。我们这里采取几何加权平均,并且将各n-gram的作用视为等重要的,即取权重服从均匀分布。
(Wn 权重 这里当做一样的)
1457484-20180808132047408-1725989073.png

Sentence brevity penalty

有一个大问题 ,短译句容易得高分!

最佳匹配长度 :best match length

如果机翻和任意一个答案长度相同,那就认为满足最佳匹配长度。这种情况下就不惩罚了。
1457484-20180808132034413-159845489.png

c:机翻总长度
r:答案总长度

1457484-20180808132025272-1435994564.png

(通常这个N取4,wn=1/4,这就是很多论文里面的一个经典指标Bleu4)

转载于:https://www.cnblogs.com/helloeboy/p/9442205.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值