法律文书生成大模型(九)

法律文书生成大模型使用说明

数据集构建

本项目数据主要分为两个部分:1.律师和用户之间的情景对话 2.对特定法律知识的问答

数据集构成
数据类型 描述 数量 占比(%)
情景对话 真实的律师用户问答 200k 60
知识问答
法律知识问题的解释性回答
9k 40
总计 - 200k 100
情景对话

真实的中文律师用户问答数据,来自CirmeKgAssitant收集的200k条情景对话数据。

利用ChatGPT根据CrimeKgAssitant的问答重新生成,使得生成的回答比原回答更详细,语言组织更规范。最终得到52k单轮问答。

根据中华人民共和国法律手册上最核心的9k法律条文,利用ChatGPT联想生成具体的情景问答,从而使得生成的数据集有具体的法律依据。

知识问答

收集法律领域的教科书,经典案例等数据,自建一个法律专业知识数据库。

针对Self-Instruct的可靠性和安全性漏洞,我们使用了基于特定知识的Reliable-

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值