LAW100-AI大模型测试集

声明

本测试集是由广东财经大学法学院《AI大模型在法律咨询场景中的表现:对国内外十个大模型的横向测评研究》课题组编写。测试集包含100个法律咨询问题,以及参考回复内容和参考关联法条,旨在测试大模型在法律咨询场景的表现。

现将测试集公开发布,本课题组声明如下:

1、本研究完全独立进行,课题组没有接受任何商家、组织或个人的委托,包括十个测评对象所在的服务商和关联机构,以及测评对象以外的服务商和关联机构。

2、编写本测试集未考虑任何大模型的偏好或擅长的方向。

3、受限于课题组人员的水平和经验,以及法律咨询的特性,编写测试集的参考回复和参考关联法条有可能存在遗漏和错误,因此对于咨询问题的回复和关联法条仅供参考,也欢迎留言指正!

测试集介绍

测试场景:法律咨询问答

题目数量:100

题目类型:

课题组成员

文立言(广东财经大学法学院学业导师、课题组指导老师)

唐梓航(22级数字法治)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值