# 数据集、代码和部署细节已在GitHub仓库中发布:
github.com/PKU-YuanGroup/ChatLaw
摘要
基于大型语言模型(LLMs)的法律助手能够提供便捷的法律咨询服务,但幻觉问题可能带来潜在的法律风险。本文介绍了Chatlaw,这是一种创新的法律助手,利用专家混合(MoE)模型和多智能体系统来提高AI驱动的法律服务的可靠性和准确性。通过将知识图谱与人工筛选相结合,我们构建了高质量的法律数据集来训练MoE模型。此模型利用不同的专家来解决各种法律问题,从而优化法律回应的准确性。另外,模仿真实律师事务所工作流程的标准作业程序(SOP)显著减少了法律服务中的错误和幻觉。我们的MoE模型在法律考试和法律专业统一资格考试中的表现优于GPT-4,展示了我们在法律咨询方面的强大能力。
增强数据集收集以覆盖全面的法律任务
为了应对现有法律数据集的缺陷,我们设计并实施了一套全面的法律数据收集和处理工作流程,成功构建了高质量的Chatlaw法律数据集。最初,我们从多个来源收集数据,并使用自动化工具进行去重和去噪处理以获得标准化的法律问答数据集。在此基础上,我们邀请法学院学生进行案件分类,并由领域专家对问题关系和节点连接进行精确定义,形成高度针对性的知识图谱和agent任务数据集。
整个数据集涉及10个大类和44个小类,总计约400万条数据样本,涵盖广泛的法律领域,包括但不限于,案件分类、法规预测、法律文书起草和子案件分割。此外,还包含公共舆论分析、命名实体识别和法律咨询等专业任务。这一多样性确保了我们的数据集能解决法律处理的各个方面,从基本的文档理解到复杂的法律推理和论证。
构建和训练MoE模型
我们的模型基于MoE Transformer架构,包含多个堆叠的MSA(多尺度注意力)模块、MoE机制和LN(层正则化)结构,并以线性分类头CLS结束。在训练阶段,我们使用自回归损失函数优化MoE模型。对于层编码,我们通过生成文本P的CLS头对输入进行变换处理。
LawBench上的性能
我们首先在LawBench上进行了测试,LawBench是一个基于中国法律系统的综合评估基准。LawBench主要涵盖三个认知层次:1)法律知识记忆:测试记忆必要法律概念、术语、条款和事实的能力;2)法律知识理解:评估大型语言模型是否能理解并解释法律文本中的实体、事件和关系;3)法律知识应用:评估正确利用并推理其法律知识以解决不同法律任务的能力。
在平均分上,我们的Chatlaw-MoE模型以60.08分显著优于GPT-4的52.35分。这一巨大差距突出表明了我们模型在不同认知层次上的有效性。
法律专业统一资格考试上的性能
另一个基准是中国法律专业统一资格考试,包括单项选择题、多项选择题和不确定选择题。这些问题涵盖各种法律领域并能有效评估大型语言模型对法律概念、原则和条款的理解和应用能力。
在2018年至2022年的法律专业统一考试中,我们的Chatlaw-MoE模型表现出色,成绩分别为113、124、143、115和78,显示出持续优越的表现。相比之下,GPT-4的得分分别为102、108、82、82和118。这一规律性的优越表现凸显了Chatlaw-MoE增强的处理法律考试题目的能力,这可能是由于其多专家系统设计,能够基于输入特征动态选择最合适的专家进行处理。
这些结果清晰地表明,Chatlaw-MoE在法律任务性能上不仅超越了专用法律模型,而且在与通用语言模型的对比中也表现优异,确立了其作为法律任务执行首选模型的地位。
Chatlaw多智能体协作框架提升法律服务可靠性
Chatlaw 包含一个基于LLM的多智能体协作系统,通过角色专门化和agent工作流模拟真实的律师咨询过程。明确的角色专门化能够将复杂工作分解为更小、更具体的任务,加速不同专业的代理相互协作。我们在我们的虚拟法律事务所中定义了四个角色:法律助理、法律研究员、法律合规、法律编辑,并指定每个角色的简档,例如角色认知、约束以及相应的知识模板和技能。
如图1©所示,代理协作工作流遵循一个顺序SOP:1)法律助理分析咨询内容并选择相应的法律知识图谱,然后询问用户问题以填充图谱节点,直到获得必要的信息;2)法律研究员基于关键信息在互联网搜索,找到相关法律条款,并根据类别分类案件以获取类似案件;3)高级律师分析相关案件并提供法律建议;4)法律编辑总结意见并起草正式法律文件,如合同,以满足用户需求。
法律助理与知识图谱
在法律专家的指导下,我们将法律咨询的过程抽象为构建专业问题知识图谱的过程。法律助理通过向用户提问,收集关键信息,扩展相应节点,直到形成完整的咨询知识图谱,作为后续过程的基础。
Chatlaw 框架中,法律助理首先根据咨询问题选择合适的预定义实体集群并初步填写信息节点。对于信息不足的节点,整合为新的问题询问用户,引导他们向知识图谱添加更多相关信息。
法律研究员与检索增强生成
法律研究员是一种基于检索增强生成(RAG)的智能体。该智能体接收由法律助理总结的知识图谱作为输入,并从外部知识库收集最新的法律条款和司法解释。利用法律助理建立的知识图谱,我们根据不同的节点关键词联合互联网和领域数据库进行检索。检索到的文档随后被并行处理,LLM评估每个文档与查询的相关性。
律师和法律编辑智能体
在实际用户咨询过程中,接下来的两个步骤涉及提供咨询建议和生成咨询文件,这在Chatlaw中由律师和法律编辑两个智能体实现。律师在咨询阶段处理用户的咨询问题和辅助信息,而编辑则专注于审查律师的文本并将其转换为最终的文档。
真实世界法律咨询表现
为了评估Chatlaw的表现,我们基于真实的司法咨询进行了综合评估,重点关注完整性、正确性、指导性和权威性等标准。Chatlaw在这些标准中始终获得最高的整体分数,特别是在完整性、指导性和权威性方面表现突出。与其他模型相比,Chatlaw在提供高质量法律咨询方面表现出优越的能力。
讨论
总体而言,Chatlaw建立了一个基于真实律师事务所实践经验的综合法律数据集,训练了一个具备精确法律咨询能力的MoE模型,并将其扩展为完整的多智能体框架。虽然AI法律助手存在着某些局限性,比如幻觉问题,但通过引入法律研究员角色,这些问题在一定程度上得到了缓解。
此外,在测试过程中,我们识别出隐私和记录保存等相关问题,因此计划加强服务的隐私保护架构,并通过各种模型压缩技术来降低计算需求。
如何系统学习掌握AI大模型?
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。
学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。
这里给大家精心整理了一份
全面的AI大模型学习资源
,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享
!
1. 成长路线图&学习规划
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
2. 大模型经典PDF书籍
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)
3. 大模型视频教程
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。
4. 2024行业报告
行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
5. 大模型项目实战
学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。
6. 大模型面试题
面试不仅是技术的较量,更需要充分的准备。
在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以
微信扫描下方CSDN官方认证二维码
,免费领取【保证100%免费
】