离线使用evaluate

一、目录

  1. 步骤
  2. demo
  3. rouge-n 含义

二、实现

  1. 步骤
离线使用evaluate: 1. 下载evaluate 文件:https://github.com/huggingface/evaluate/tree/main
                 2. 离线使用  路径+/evaluate-main/metrics/rouge
  1. demo
import evaluate
'''
离线使用evaluate: 1. 下载evaluate 文件:https://github.com/huggingface/evaluate/tree/main
                 2. 离线使用  路径+/evaluate-main/metrics/rouge
'''
rouge=evaluate.load("/app/tensorrt_llm/examples/qwen2/evaluate-main/metrics/rouge")
predictions = ["Transformers Transformers are fast plus efficient",
               "Good Morning", "I am waiting for new Transformers"]
references = [
              ["HuggingFace Transformers are fast efficient plus awesome",
              "Transformers are awesome because they are fast to execute"],

              ["Good Morning Transformers", "Morning Transformers"],

              ["People are eagerly waiting for new Transformer models",
               "People are very excited about new Transformers"]
results = rouge.compute(predictions=predictions, references=references)
print(results)
  1. rouge-n 含义
    ROUGE-N: 在 N-gram 上计算召回率
    ROUGE-L: 考虑了机器译文和参考译文之间的最长公共子序列
    ROUGE-W: 改进了ROUGE-L,用加权的方法计算最长公共子序列在这里插入图片描述
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值