定制专属大模型（以《甄嬛传》为例）（Datawhale AI 冬令营）

karios0085

已于 2024-12-09 21:39:31 修改

阅读量845

点赞数 17

文章标签：人工智能深度学习机器学习

于 2024-12-09 21:37:09 首次发布

本文链接：https://blog.csdn.net/karios0085/article/details/144358388

版权

一、学习目标：

本次学习的目标是通过简单的步骤定制一个专属大模型，使其能够模仿甄嬛的语气和风格，打造出一个专属的聊天机器人——Chat-嬛嬛。通过这一实践，大家可以了解如何通过微调技术定制大模型，以及在实际应用中如何提高模型的专业性和个性化。

注册讯飞星辰Maas平台：
访问官网并进行注册，完成手机号快捷登录，准备使用讯飞的微调平台。
- 官网链接：讯飞星辰Maas官网
下载嬛嬛数据集：
数据集是训练模型所需的核心，下载《甄嬛传》剧本中的甄嬛台词数据集。
- 数据集下载链接：嬛嬛数据集
定制大模型：
- 进入平台，点击“创建模型”，配置基础信息，确保选择正确的模型。
- 点击“创建数据集”，导入下载的数据集，并提交任务。
- 提交后可能需要排队等待，建议尽早提交，避免过长的等待时间。
创建应用：
- 在平台上创建应用，填写应用相关信息，选择已创建的模型，准备体验。
体验AI嬛嬛：
- 微调完成后，点击发布服务，开始体验定制的专属大模型。
- 可以与模型对话，测试其效果，验证模型是否成功模仿了甄嬛的语气和风格。

在本次学习中，使用的数据集采用了Alpaca格式。该格式的特点包括：

关于嬛嬛数据集格式特点：
- instruction字段是必填的，用来指示任务。
- input字段在开放式任务中可以为空字符串，表示模型可以根据上下文生成答案。
- output字段是必填的，不是所有样本都需要标准答案，具体取决于任务的性质。
微调技术：
- 微调（fine-tuning）是指在预训练模型的基础上&