一、学习目标:
本次学习的目标是通过简单的步骤定制一个专属大模型,使其能够模仿甄嬛的语气和风格,打造出一个专属的聊天机器人——Chat-嬛嬛。通过这一实践,大家可以了解如何通过微调技术定制大模型,以及在实际应用中如何提高模型的专业性和个性化。
二、步骤概览:
-
注册讯飞星辰Maas平台:
访问官网并进行注册,完成手机号快捷登录,准备使用讯飞的微调平台。- 官网链接:讯飞星辰Maas官网
-
下载嬛嬛数据集:
数据集是训练模型所需的核心,下载《甄嬛传》剧本中的甄嬛台词数据集。- 数据集下载链接:嬛嬛数据集
-
定制大模型:
- 进入平台,点击“创建模型”,配置基础信息,确保选择正确的模型。
- 点击“创建数据集”,导入下载的数据集,并提交任务。
- 提交后可能需要排队等待,建议尽早提交,避免过长的等待时间。
-
创建应用:
- 在平台上创建应用,填写应用相关信息,选择已创建的模型,准备体验。
-
体验AI嬛嬛:
- 微调完成后,点击发布服务,开始体验定制的专属大模型。
- 可以与模型对话,测试其效果,验证模型是否成功模仿了甄嬛的语气和风格。
三、微调数据集格式(Alpaca格式):
在本次学习中,使用的数据集采用了Alpaca格式。该格式的特点包括:
- instruction字段:用于提供任务的指令,必填。
- input字段:输入内容,某些任务可能为空。
- output字段:模型的回答,必填。
- history字段:包含对话历史,用于多轮对话任务。
四、思考题解答:
- 关于嬛嬛数据集格式特点:
- instruction字段是必填的,用来指示任务。
- input字段在开放式任务中可以为空字符串,表示模型可以根据上下文生成答案。
- output字段是必填的,不是所有样本都需要标准答案,具体取决于任务的性质。
- 微调技术:
- 微调(fine-tuning)是指在预训练模型的基础上&