文章目录
前言
自我认知的修改
对ChatGLM3-6B大模型进行微调的第一步,是改变其自我认知,通过构造自我认知数据集self_cognition,来对ChatGLM3-6B的自我认知进行修正,预期效果为将其自我认知修改为由山东大学软件学院CLD团队开发的面向专业人士的中文法律文书生成助手
一、指令数据集
一条指令数据集由instruction、input、output三个部分组成。需要注意的是insturction和input之间没有严格的区分,比如下面两个例子表达的意思是一样的,只是在形式上不一样。
# 例子1
instruction: "write an essay about school safety"
input:""
output:"...."
# 例子2
instruction: "write an essay about the following topic"
input