人工智能 AI项目 ROUGE评估算法简记

鹏晓星

已于 2023-07-16 14:53:39 修改

阅读量675

点赞数

文章标签：学习人工智能自然语言处理

于 2023-06-06 16:09:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44194638/article/details/131069640

版权

目录

- ROUGE

ROUGE

ROUGE的全称是Recall-Oriented Understudy for Gisting Evaluation, 是一种基于召回率指标的评价算法.

核心思想

由多个专家分别生成人工摘要, 构成标准摘要集.
将模型生成的自动摘要和人工摘要做对比, 通过统计两者之间重叠的基本单元的数量, 来评价模型摘要的表现.
通过多条人类专家的摘要做对比, 提高了评价系统的稳定性和健壮性.

评价标准

ROUGE-N评价:
主要统计n-gram上的召回率, 比较人工摘要和模型摘要分别计算n-gram的结果.
ROUGE-L评价:
L指最长公共子序列(Longest Common Subsequence, LCS), 比较人工摘要和模型摘要的最长公共子序列.

ROUGE-N

在这里插入图片描述
示例：
机器摘要C: a cat is on the table
人工摘要S1: there is a cat on the table

在这里插入图片描述

优点: 直观, 简洁, 能反应文本的词序.
缺点: 区分度不高, 且当N > 3时, ROUGE-N值通常很小.

ROUGE-L

在这里插入图片描述

R_LCS: 表示召回率.
P_LCS: 表示精确率.
F_LCS: 表示ROUGE-L分数.

化简后：
在这里插入图片描述

通常beta超参值很大，第一项可以忽略

示例：
机器摘要C: a cat is on the table
人工摘要S1: there is a cat on the table

按照公式R_LCS计算,
分母len(S1) = 7,
分子LCS(C, S1) = 5 (a cat on the table),
R_LCS = 5/7, 即ROUGE-L分数等于5/7.

优点: 不要求词的连续匹配, 只要求按词的出现顺序匹配即可, 能够像n-gram一样反应句子级别的词序. 自动匹配最长公共子序列, 不需要预定义n-gram的长度超参数.

缺点: 只计算一个最长子序列, 最终的值忽略了其他备选的最长子序列及较短子序列的特征和影响.

心得：初步了解了ROUGE，简单记录一下，还有ROUGE-W和ROUGE-S两个标准，暂不记录

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
人工智能 AI项目 ROUGE评估算法简记

优点: 不要求词的连续匹配, 只要求按词的出现顺序匹配即可, 能够像n-gram一样反应句子级别的词序. 自动匹配最长公共子序列, 不需要预定义n-gram的长度超参数.将模型生成的自动摘要和人工摘要做对比, 通过统计两者之间重叠的基本单元的数量, 来评价模型摘要的表现.缺点: 只计算一个最长子序列, 最终的值忽略了其他备选的最长子序列及较短子序列的特征和影响.分子LCS(C, S1) = 5 (a cat on the table),缺点: 区分度不高, 且当N > 3时, ROUGE-N值通常很小.
复制链接

扫一扫

鹏晓星 CSDN认证博客专家 CSDN认证企业博客

码龄5年

38: 原创

11万+: 周排名

185万+: 总排名

6万+: 访问

: 等级

768: 积分

25: 粉丝

60: 获赞

19: 评论

236: 收藏

私信

关注

热门文章

分类专栏

最新评论

人工智能 AI项目统计语言模型之HMM初步学习总结
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/614544826。
th:href路径问题
闻风少年宇航员: 同样的问题，帮我解决了，感谢！
使用Wireshark抓包获取在网页中输入的账号密码
［好名字］: 你好请问wireshark抓包后抓不到POST请求怎么办？重新安装wireshark一步一步来也不行，是哪里出现问题了吗
th:href路径问题
高家琛i: bo主，我有个问题项问一下，我现在用th:href="@{路径}"，时候路径前面必须要加‘上http:’ 才是绝对路径，路径不加‘http:’就是相对路径，我看视频老师都不加http:也能用，但我不行，是什么原因呢？版本问题吗？
使用Wireshark抓包获取在网页中输入的账号密码
Alusd: 呜呜呜我也是，大佬们最后怎么解决了qwq

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

鹏晓星 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。