自我认知数据集的设计与构建

xyx20030310

已于 2024-05-30 15:51:59 修改

阅读量1.1k

点赞数 14

文章标签：人工智能机器学习语言模型

于 2024-05-29 20:58:14 首次发布

本文链接：https://blog.csdn.net/xyx281973881/article/details/139300248

版权

前言

自我认知的修改

对ChatGLM3-6B大模型进行微调的第一步，是改变其自我认知，通过构造自我认知数据集self_cognition，来对ChatGLM3-6B的自我认知进行修正，预期效果为将其自我认知修改为由山东大学软件学院CLD团队开发的面向专业人士的中文法律文书生成助手

一条指令数据集由instruction、input、output三个部分组成。需要注意的是insturction和input之间没有严格的区分，比如下面两个例子表达的意思是一样的，只是在形式上不一样。

# 例子1
instruction: "write an essay about school safety"
input:""
output:"...."

# 例子2
instruction: "write an essay about the following topic"
input