山东大学软件学院项目实训项目_大模型自我认知数据集的构建

自我认知数据集的构建:

//instruction: str, describes the task the model should perform

//input(自我认知一般涉及不到): str, optional context or input for the task. For example, when the instruction is "Summarize the following article", the input is the article.//

//output: str, the answer to the instruction

数据集的分类:

我们把自我认知数据集分成五类:

一:随意的交流对话

你好

你是谁?

早上/中午/晚上好

二:提问模型的功能

你的功能是什么?

你能处理什么法律领域?

你能生成什么类型的文书?

你擅长什么语言

你能生成民事裁定书/判决书/合同吗?

三:直接描述需求

我是一个法律从业者

我需要帮助

我要法律咨询

我要生成法律文书

四:回答反馈

你的回答是否可靠

你是怎么训练/开发出来的

是不是AI

与其他AI有什么不同

五:身份问题

你是Chatglm吗?

你是聊天机器人吗?

你是清华开发的吗?

是chatgpt吗

我负责第三类自我认知数据集的编写:

data-demo如下:

 

  • 12
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值