【论文泛读74】Lawformer：中国法律长文件的预训练语言模型

最新推荐文章于 2024-12-09 13:53:52 发布

及时行樂_

最新推荐文章于 2024-12-09 13:53:52 发布

阅读量2.6k

点赞数 1

分类专栏：论文 # NLP_paper 文章标签：法律 paper

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41485273/article/details/116719246

版权

Lawformer是一款基于Longformer的预训练模型，专为处理中国法律长文件设计，提升法律AI任务如判决预测、相似案例检索的性能。在多个法律任务中表现出色，未来将探索法律知识增强及生成性预训练。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

贴一下汇总贴：论文阅读记录

论文链接：《Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents》

一、摘要

法律人工智能（LegalAI）旨在通过人工智能技术（尤其是自然语言处理（NLP））使法律制度受益。最近，受通用领域中预训练语言模型（PLM）成功的启发，许多LegalAI研究人员致力于将PLM应用于法律任务。但是，利用PLM来解决法律任务仍然具有挑战性，因为法律文件通常包含数千个令牌，这远远超过主流PLM可以处理的长度。在本文中，我们发布了基于Longformer的预训练语言模型，称为Lawformer，用于理解中国法律长文件。我们在各种LegalAI任务上评估Lawformer，包括判决预测，相似案例检索，法律阅读理解和法律问题解答。

二、结论

在本文中，我们预训练了一个基于Longformer的语言模型，它包含了数千万个刑事和民事案件文档，我们称之为Lawformer。然后我们对Lawformer在几个典型的法律问题上的任务进行了评估，包括法律判断预测、相似案例检索、法律阅读理解和法律问题回答。结果表明，Lawformer可以在长序列输入的任务上实现显著的性能提升。虽然Lawformer可以提高法律文档理解的性能，但实验结果也表明挑战依然存在。

今后࿰

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。