1. 简介
BLEU(Bilingual Evaluation Understudy),由 IBM 提出用于定义机器翻译译文与参考译文之间的相似度。
结合 python nltk 模块中的源码,我们来看看 BLEU 是如何计算相似度的。
首先祭出公式:
NLTK 模块中实现了这里的公式,主要包括三个函数:
# 计算 BLEU 的值
def bleu(references, candidate, weight)
# 私有函数,计算修正的n元精确率(Modified n-gram Precision)
def _modifi