声明
本测试集是由广东财经大学法学院《AI大模型在法律咨询场景中的表现:对国内外十个大模型的横向测评研究》课题组编写。测试集包含100个法律咨询问题,以及参考回复内容和参考关联法条,旨在测试大模型在法律咨询场景的表现。
现将测试集公开发布,本课题组声明如下:
1、本研究完全独立进行,课题组没有接受任何商家、组织或个人的委托,包括十个测评对象所在的服务商和关联机构,以及测评对象以外的服务商和关联机构。
2、编写本测试集未考虑任何大模型的偏好或擅长的方向。
3、受限于课题组人员的水平和经验,以及法律咨询的特性,编写测试集的参考回复和参考关联法条有可能存在遗漏和错误,因此对于咨询问题的回复和关联法条仅供参考,也欢迎留言指正!
测试集介绍
测试场景:法律咨询问答
题目数量:100
题目类型:
课题组成员
文立言(广东财经大学法学院学业导师、课题组指导老师)
唐梓航(22级数字法治)