ChatLaw:北大团队智能法律助手,国产大模型成功应用普惠法律服务

 技术发展的本质是普惠,用技术降低普通人获取法律知识的成本,向社会输出普惠的公平正义。—— 北京大学 ChatLaw 项目组

刚刚清华团队升级了国产大模型:ChatGLM2-6B,ChatGLM2-6B 初体验

转眼这两天北大团队推出的智能法律助手 ChatLaw 又火了。(官方7.4更新:服务器暂时崩溃,算力已达上限,我们正在修复,大家可自行前往GItHub部署测试版模型。)

629c7a96e7788d16372254caa8e15352.png

01

全程智能法律援助

以一个普通的劳动者遇到的劳动纠纷全过程为例,ChatLaw 全程提供不亚于专业律师的法律援助:智能理解需求,语音文件输入,结构化抽取要素信息,法条引用准确,智能生成法律文书。

首先,劳动者询问,被公司强行解聘,这种情况下,如何维权?‍‍‍‍‍‍‍

ae604cc410f7ab981a23e3ce0de1f69a.png

ChatLaw 很自然询问是否还有其他文件、邮件之类证据,用户上传后,智能助手自动分析,归纳资料中跟案件相关的信息:

af234b1cf311c71920406880bada70d5.png

2ed67c6c375a1b2ee541105f59da1b8e.png

ChatLaw 是一个支持多模态的大模型,在劳动者补充了语音资料后,将对话录音和之前文件、邮件资料补充到证据链的思维导图中。

62b691d06789426ecda7c78c0ad569f7.png

随后,劳动者询问是否可以提供法律咨询建议,智能助手回答不能,但是可以根据提供的情况,给予简单的分析(意思是仅供参考),并建议寻找法律援助以及咨询律师事务所,最下方还贴心的给予了相关的案例和法条建议。‍‍‍‍‍‍‍‍

3262c9663f0f61d7262837dade248673.png

劳动者进一步请求写一份劳动仲裁的起诉书,ChatLaw给出了一份看起来不亚于专业律师的建议和起诉书。‍‍‍‍‍‍

ef92b8792fb61aba183dddf8825a1b1e.png

调解流程建议书和诉讼状(供参考):

3caa20fa219fd39af218ae18787181ca.png

02

缘起和“先验知识约束”

提供普惠的法律服务是件难事。

2022年,全国法院共受理案件3372.3万件,其中由律师办理诉讼案件仅有824.4万件。74%的案件没有律师参与,当事人只能自己写材料、诉讼、协商。

这背后是专业律师供给不足

截止2021年底,全国共有57.48万执业律师,其中具备高素质与专业能力的律师更少。法律服务市场上,供给远远小于需求,这直接导致了法律服务以被动获客为主的行业结构。相当数量的普通人遭遇社会不公时,找不到律师,也不知道如何运用法律维护权益。

光看知乎上那么多关于“劳动仲裁”的问题数量就知道,无法获得法律援助,而不知道维护权益的普通人有多少。‍‍‍‍‍

举个例子,只是查法条就能难倒70%的普通人。更不用说调解、诉讼所需要的大量流程性文书。

这一切直到大语言模型出现。技术或许成为了解决这一命题的靠谱方案

用户通过多轮对话可以无限逼近事实,从模型里获取准确且专业的建议。

C hatLaw 团队作为技术的提供者,负责任的为模型生成的内容负责。简单地用法律对话数据做微调,不足以支撑在真正法律场景落地。在涉及法律问题时,即使是像GPT4这样最先进的模型,也会出现幻觉和偏误。

为了确保模型生成的稳健性,需要从模型训练阶段就开始介入和干预。团队基于大量的判例文书原始文本和法律法规、地方政策,构建了法律知识库。同时,通过与北大国际法学院、行业知名律师事务所进行合作,确保知识库能及时更新,同时保证数据的专业性和可靠性。

在训练阶段,团队将这些法律数据大规模注入模型,并对这些知识进行特殊处理和加强,以确保模型在后续推理中具备法律先验知识并保持稳健。

同时,ChatLaw团队也在推理时引入多个模块,将通识模型、专业模型和知识库融为一体。通过在推理中进行约束,才能够确保模型生成正确的法律法规,尽可能减少模型幻觉。

这一整套的技术方案被定义为“先验知识约束”。

“先验知识约束”可以确保模型生成法律内容的准确性。团队整理了过去十年的中国国家司法考试试题,并建立了一个包含2000个问题的测试集。通过ELO机制进行检验,ChatLaw模型在测试集上获得了最高分。这充分说明了“先验知识约束”的有效性,让百亿级参数量的模型也能在专业问题上保持一定的准确度。

03

调度模型

只是准确还不够。

法律咨询是高度复杂的场景。其流程标准化,但当事人事实具有多变性。

这意味着,模型的智能度是至关重要的要素。

为了提升模型智能度,同时增强模型的延展性。ChatLaw 用了一个“取巧”的办法。那就是“调度模型”的概念。用针对性微调,训练了一个专用调度模型。

ChatLaw 为调度模型准备了一个极其丰富的模型&插件库。调度模型通过对用户提问进行语义理解,来对子模型和插件进行调度并重组,最终呈现出多个模态的输入和输出。‍‍

033ecdbe8e9f73e8c450281c4aa9d1f9.jpeg

调度模型原理图基于这套体系,ChatLaw 将文件、音频、文字整合在一起,同时支持法律援助、法律文书、思维导图等多样化输出。这使得智能法律助手具有高度的延展性。

例如,当模型判断用户的描述不够具体时,它会向用户要求上传文件,并根据用户提供的信息进行归纳和分析。

不仅仅是归纳事实,ChatLaw还会基于事实生成具体的法律建议、甚至是法律文书。

当用户表露出需要人工服务的意图,模型还会向用户推荐周边的法律援助中心。

所以,基于调度模型,才有了上面一节展示的智能助手全程提供专业的法律方面建议的场面。‍‍

最后,例行放上官方地址,感兴趣的朋友可以去体验:

https://www.chatlaw.cloud/

模型开源地址:

https://github.com/PKU-YuanGroup/ChatLaw

往期热门文章推荐:

为什么对ChatGPT、ChatGLM这样的大语言模型说“你是某某领域专家”,它的回答会有效得多?(二)

终于部署成功!GPU 云环境搭建 ChatGLM2-6B 坎坷路

Prompt 用法大全!让 ChatGPT 更智能的六种策略(下)

拥抱未来,学习 AI 技能!关注我,免费领取 AI 学习资源。

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值