FastEval 开源项目教程

FastEval 开源项目教程

FastEvalFast & more realistic evaluation of chat language models. Includes leaderboard.项目地址:https://gitcode.com/gh_mirrors/fas/FastEval

1、项目的目录结构及介绍

FastEval 项目的目录结构如下:

FastEval/
├── README.md
├── requirements.txt
├── setup.py
├── fasteval/
│   ├── __init__.py
│   ├── main.py
│   ├── config.py
│   ├── benchmarks/
│   │   ├── __init__.py
│   │   ├── mt_bench.py
│   │   ├── human_eval_plus.py
│   │   ├── ds1000.py
│   │   ├── cot/
│   │   │   ├── __init__.py
│   │   │   ├── gsm8k.py
│   │   │   ├── math.py
│   │   │   ├── bbh.py
│   │   │   ├── mmlu.py
│   │   ├── custom_test_data/
│   │   │   ├── __init__.py
│   │   │   ├── custom_data.py
│   ├── utils/
│   │   ├── __init__.py
│   │   ├── prompt_templates.py
│   │   ├── model_utils.py
├── tests/
│   ├── __init__.py
│   ├── test_main.py
│   ├── test_config.py
│   ├── test_benchmarks.py
│   ├── test_utils.py

目录结构介绍

  • README.md: 项目说明文档。
  • requirements.txt: 项目依赖文件。
  • setup.py: 项目安装脚本。
  • fasteval/: 项目主目录。
    • __init__.py: 初始化文件。
    • main.py: 项目启动文件。
    • config.py: 项目配置文件。
    • benchmarks/: 基准测试目录。
      • __init__.py: 初始化文件。
      • mt_bench.py: MT-Bench 基准测试。
      • human_eval_plus.py: HumanEval+ 基准测试。
      • ds1000.py: DS-1000 基准测试。
      • cot/: Chain of Thought 基准测试目录。
        • __init__.py: 初始化文件。
        • gsm8k.py: GSM8K 基准测试。
        • math.py: Math 基准测试。
        • bbh.py: BBH 基准测试。
        • mmlu.py: MMLU 基准测试。
      • custom_test_data/: 自定义测试数据目录。
        • __init__.py: 初始化文件。
        • custom_data.py: 自定义数据测试。
    • utils/: 工具目录。
      • __init__.py: 初始化文件。
      • prompt_templates.py: 提示模板工具。
      • model_utils.py: 模型工具。
  • tests/: 测试目录。
    • __init__.py: 初始化文件。
    • test_main.py: 主程序测试。
    • test_config.py: 配置文件测试。
    • test_benchmarks.py: 基准测试测试。
    • test_utils.py: 工具测试。

2、项目的启动文件介绍

项目的启动文件是 fasteval/main.py。该文件包含了项目的主要逻辑和启动代码。通过运行该文件,可以启动 FastEval 项目并执行模型评估。

主要功能

  • 解析命令行参数。
  • 加载配置文件。
  • 初始化基准测试。
  • 执行模型评估。
  • 输出评估结果。

3、项目的配置文件介绍

项目的配置文件是 fasteval/config.py。该文件包含了项目的配置信息,如基准测试的配置、模型类型、模型名称等。

主要配置项

  • BENCHMARKS: 基准测试列表。
  • MODEL_TYPE: 模型类型。
  • MODEL_NAME: 模型名称。
  • OPENAI_API_KEY: OpenAI API 密钥。

通过修改该配置文件,可以灵活地配置 FastEval 项目,以适应不同的评估需求。


以上是 Fast

FastEvalFast & more realistic evaluation of chat language models. Includes leaderboard.项目地址:https://gitcode.com/gh_mirrors/fas/FastEval

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

史锋燃Gardner

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值