1、基础作业:
作业参考官方教程:https://github.com/InternLM/tutorial/blob/main/xtuner/self.md
1.1 生成数据
import json
# 输入你的名字
name = 'TAICHIKF'
# 重复次数
n = 10000
data = [
{
"conversation": [
{
"input": "请做一下自我介绍",
"output": "我是{}的小助手,内在是上海AI实验室书生·浦语的7B大模型哦".format(name)
}
]
},
{
"conversation": [
{
"input": "你的github网址是什么",
"output": "https://github.com/TAICHIKF"
}
]
}
]
for i in range(n):
data.append(data[0])
data.append(data[1])
with open('personal_assistant.json', 'w', encoding='utf-8') as f:
json.dump(data, f, ensure_ascii=False, indent=4)
1.2 结果对比
微调前(回答比较官方)
微调后(对自己的身份地位有了清晰的认知)
2、进阶作业:
将训练好的Adapter模型权重上传到 OpenXLab、Hugging Face 或者 MoelScope 任一一平台。
将训练好后的模型应用部署到 OpenXLab 平台,参考部署文档请访问:https://aicarrier.feishu.cn/docx/MQH6dygcKolG37x0ekcc4oZhnCe