[Datawhale AI 夏令营]大模型微调-Task 01 笔记

1. 任务学习目标

  1. 学习大模型微调的基本概念
  2. 学习微调数据处理方法

2. 任务赛事要求

  1. 任务:通过微调大模型生成高考中英文阅读模拟题及答案
  2. 平台:
    1. 百度星火平台(生成数据集STEP2)(模型验证STEP4)👉星火平台链接
    2. 讯飞开放平台(模型微调STEP3)👉讯飞平台链接
    3. 讯飞赛事平台(报名赛事STEP1)(提交文件、获得分数STEP5)👉讯飞比赛平台

3. 学习步骤详细描述

  1. STEP1:报名赛事
    1. 步骤描述:注册并登录讯飞开放平台,完成个人认证并参与比赛。
    2. 步骤比喻:夏令营基于一个讯飞比赛进行。
  2. STPE2:运行Baseline
    1. 步骤描述:
      1. Baseline是机器学习中的一个基准模型,它提供了一个性能比较的起点。
      2. 访问百度AI Studio提供的项目链接,运行预设的数据处理和微调测试代码。
      3. 完成代码运行后,下载output.jsonl文件,这是模型微调所需的关键数据集,包含了原始文本和问题答案对。
    2. 步骤比喻:使用百度AI Studio提供的代码处理数据,生成数据作为训练集,以推向下一步在讯飞AI平台中进行训练。
  3. STEP3:模型微调
    1. 步骤描述:
      1. 在预训练模型(Spark_13b)的基础上,针对特定任务进行再训练,以提高模型在该任务上的表现。
      2. 在讯飞大模型定制训练平台上,上传STEP2的output.jsonl文件作为训练数据。
      3. 选择适当的模型参数和配置,开始模型训练。训练时间可能因模型大小和数据量而有所不同。
      4. 需要记录自己训练模型的相关数据,包含:SPARKAI_APP_IDSPARKAI_API_SECRETSPARKAI_API_KEY等。
    2. 步骤比喻:类似于根据数据集的要求,使用预训练模型训练出符合自己要求的大模型。
  4. STEP4:模型测试
    1. 步骤描述:
      1. SPARKAI_APP_IDSPARKAI_API_SECRETSPARKAI_API_KEY等数据复制到百度AI Studio模型里。
      2. 运行测试代码,观察模型输出,确保模型能够正确理解文本并生成准确的答案。
    2. 步骤比喻:测试自己使用讯飞训练的模型是否能够正确完成任务。
  5. STEP5:提交文件、获得分数
    1. 步骤描述:将微调后的大模型的resourceid提交到讯飞赛事平台上,获得分数。
    2. 步骤比喻:实际参与比赛,提交自己的大模型结果,并得到训练的大模型分数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值