Datawhale x 讯飞星辰Maas速通嬛嬛大模型！（零代码基础友好）

最新推荐文章于 2025-04-06 19:41:05 发布

Vavyyy

最新推荐文章于 2025-04-06 19:41:05 发布

阅读量1.1k

点赞数 13

文章标签：人工智能

本文链接：https://blog.csdn.net/Vavyyy/article/details/144387299

版权

随着AI大模型的迅猛发展，在使用各大企业竞相推出基础通用大模型时，我们往往面临大模型“行行皆通而不精”的问题，在一些特殊语境下无法给出专业化、精准化的落实解决方案。尤其是在角色扮演、模拟特定人物聊天语气等场合。

于是各种经过特殊训练的“智能体”（常见如豆包或通义千问中的各种“问题专家”），即对应定制专属大模型。我们期待通过投喂特定语料改造大模型，使之训练为专业领域中有更加出色的表现！

本篇笔记将基于《甄嬛传》剧本中的甄嬛台词 ，通过五个简单的步骤，不写一行代码，打造一个模仿甄嬛语气、风格的专属聊天模型—— Chat-嬛嬛聊天体 。

Step1：平台获取——注册讯飞星辰Maas

链接：星火大模型精调平台（点击即可）

Step2：下载嬛嬛数据集

数据来源：self-llm/dataset/huanhuan.json at master · datawhalechina/self-llm · GitHub

下载官方提供的嬛嬛语料数据集即可~

Tip1：什么是数据集？

“微调的数据集是大模型的关键。”

真正复杂的工作都在清洗数据、处理、生成、归类数据上，这才是影响大模型的关键节点难点。——散步，Tianji作者

常见微调数据集以Alpaca格式展开，更加适合解决单轮、以任务为导向的指令微调任务。

接下来节选嬛嬛语料包中的部分片段为例：
{
    "instruction": "小姐，别的秀女都在求中选，唯有咱们小姐想被撂牌子，菩萨一定记得真真儿的——",
    "input": "",
    "output": "嘘——都说许愿说破是不灵的。"
}
1. instruction：

任务的指令，模型需要完成的具体操作，一般可以对应到用户输入的 Prompt ；

2. input：

任务所需的输入内容。若任务是开放式的，或者不需要明确输入，可以为空字符串；

（这里对于空字符串的处理实际上对于后面聊天体微调效果不明显有影响）

3. output：

在给定指令和输入的情况下，模型需要生成的期望输出，也就是对应的正确结果或参考答案。（即训练的数据，给大模型投喂“参考答案”）

此外我们可以看到还有system与history两个选项对应系统与历史会话作用优化微调模型。

显然像Alpaca格式这样较为线性逻辑叙事的结构更利于我们与模型去理解，处理。明确地把任务指令与输入prompt分开，适用于自然语言处理任务（如文本生成、总结等）