定制专属大模型(以《甄嬛传》为例)(Datawhale AI 冬令营)

一、学习目标:

本次学习的目标是通过简单的步骤定制一个专属大模型,使其能够模仿甄嬛的语气和风格,打造出一个专属的聊天机器人——Chat-嬛嬛。通过这一实践,大家可以了解如何通过微调技术定制大模型,以及在实际应用中如何提高模型的专业性和个性化。

二、步骤概览:

  1. 注册讯飞星辰Maas平台
    访问官网并进行注册,完成手机号快捷登录,准备使用讯飞的微调平台。

  2. 下载嬛嬛数据集
    数据集是训练模型所需的核心,下载《甄嬛传》剧本中的甄嬛台词数据集。

  3. 定制大模型

    • 进入平台,点击“创建模型”,配置基础信息,确保选择正确的模型。
    • 点击“创建数据集”,导入下载的数据集,并提交任务。
    • 提交后可能需要排队等待,建议尽早提交,避免过长的等待时间。
  4. 创建应用

    • 在平台上创建应用,填写应用相关信息,选择已创建的模型,准备体验。
  5. 体验AI嬛嬛

    • 微调完成后,点击发布服务,开始体验定制的专属大模型。
    • 可以与模型对话,测试其效果,验证模型是否成功模仿了甄嬛的语气和风格。

三、微调数据集格式(Alpaca格式):

在本次学习中,使用的数据集采用了Alpaca格式。该格式的特点包括:

  • instruction字段:用于提供任务的指令,必填。
  • input字段:输入内容,某些任务可能为空。
  • output字段:模型的回答,必填。
  • history字段:包含对话历史,用于多轮对话任务。

四、思考题解答:

  1. 关于嬛嬛数据集格式特点:
    • instruction字段是必填的,用来指示任务。
    • input字段在开放式任务中可以为空字符串,表示模型可以根据上下文生成答案。
    • output字段是必填的,不是所有样本都需要标准答案,具体取决于任务的性质。
  2. 微调技术:
    • 微调(fine-tuning)是指在预训练模型的基础上&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值