ROUGE评测标准

简介

ROUGE 指标的全称是 (Recall-Oriented Understudy for Gisting Evaluation),主要是基于召回率 (recall) 的。ROUGE 是一种常用的机器翻译和文章摘要评价指标。

ROUGE-N

ROUGE-N 主要统计 N-gram 上的召回率
在这里插入图片描述
公式的分母是统计在参考译文中 N-gram 的个数,而分子是统计参考译文机器译文共有的 N-gram 个数。(所以是recall。总共有若干个阳性样本,看你的方法能够找出多少个阳性的)
例如:

机器译文: a cat is on the table
参考译文: there is a cat on the table 

在这里插入图片描述
如果给定多个参考译文,例如有M 个译文 S1, …, SM。ROUGE-N 会分别计算机器译文和这些参考译文的 ROUGE-N 分数,并取其最大值.

ROUGE-L

ROUGE-L 计算的时候使用了机器译文和参考译文的最长公共子序列. C表示机器译文、S表示参考译文。R_LCS就是Recall,P_LCS就是precision(

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值