bleu 是用来衡量机器翻译结果好坏的指标
最初的版本:
使用累加器计算candidate中词在reference中出现词的次数,除以总次数称为precision
但可能会出现以下情况:
此时
显然这个计算方法是存在bug的
改良版:
可以解决大部分问题但是
所以加入短句惩罚
此处定义一个概念, 当candidate doc 长度等于任何一个reference doc的长度的时候, 我们称此时为最佳匹配
bleu 是用来衡量机器翻译结果好坏的指标
最初的版本:
使用累加器计算candidate中词在reference中出现词的次数,除以总次数称为precision
但可能会出现以下情况:
此时
显然这个计算方法是存在bug的
改良版:
可以解决大部分问题但是
所以加入短句惩罚
此处定义一个概念, 当candidate doc 长度等于任何一个reference doc的长度的时候, 我们称此时为最佳匹配