法律文书生成大模型（四）

「已注销」

已于 2024-06-24 13:08:24 修改

阅读量1.6k

点赞数 21

文章标签：人工智能 chatgpt

于 2024-06-24 13:06:08 首次发布

本文链接：https://blog.csdn.net/m0_62512118/article/details/139922674

版权

模型训练细节

深入模型训练：细节、参数设置及LORA微调在train.py中的实践

概述：

在深度学习的世界中，模型训练是一个复杂而关键的过程。一个经过精心训练和调整的模型能够更准确地捕捉数据的内在规律，从而实现更好的性能。本篇博客将详细介绍模型训练的细节、参数设置的重要性以及如何在train.py中使用LORA（Low-Rank Adaptation）进行微调。

一、模型训练细节

模型训练涉及多个方面，包括但不限于数据加载、前向传播、反向传播、优化器更新等。在每个阶段，都有一些值得关注的细节：

数据加载：确保数据按照正确的顺序和格式加载到模型中。对于大型数据集，可能需要使用数据加载器（DataLoader）进行批量加载。
前向传播：模型接收到输入数据后，会经过多个层进行前向传播，最终输出预测结果。在这一阶段，需要确保模型的结构和参数设置正确。
损失计算：将模型的预测结果与真实标签进行比较，计算损失值。损失函数的选择对于模型的性能至关重要。
反向传播<

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

「已注销」

关注关注

21
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

大模型在法律方面的应用及方案

NLP与推荐算法

04-17

671

大模型在法律行业的应用及落地方案

法律大模型-指令微调数据集

07-17

依据本地法律数据文本构建的法律大模型指令微调数据集。利用三段论推理来选择和评估当事人的论点是一种常见的做法。三段论中包含大前提、小前提和结论三个部分，应用到法律领域中时，大前提通常是由相关法条构成的法律依据，小前提通常时由犯罪要件构成的案情分析结果，结论通常是由最终适用的法条和判决结果构成。在实践中，三段论是法官广泛使用的法律推理的标准形式，以确保逻辑论点是合理和无可争辩的。 数据集的体量为11k。数据格式为 alpaca 格式。司法三段论，是把三段论的逻辑推理应用于司法实践的一种思维方式和方法。类比于三段论的结构特征，司法三段论就是法官在司法过程中将法律规范作为大前提，以案件事实为小前提，最终得出判决结果的一种推导方法。通过该数据集进行指令微调大模型，可使得模型对案件可能结果的有力洞察，还有助于帮助用户更好地理解案件的法律依据和潜在风险。

参与评论您还未登录，请先登录后发表或查看评论

法律文书生成大模型（九）

m0_62512118的博客

06-22

664

针对Self-Instruct的可靠性和安全性漏洞，我们使用了基于特定知识的Reliable-Self-Instruction：通过提供具体的法律知识文本，先让ChatGPT生成与该段法律知识内容与逻辑关系相关的若干问题，再通过“文本段-问题”对的方式让ChatGPT回答问题，从而使ChatGPT能够生成含有法律信息的回答，保证回答的准确性。这些模型在训练过程中，可能会使用到50万中文裁判文书数据、基于Chinese-LLaMA-7B模型的二次预训练以及基于更大规模的高质量法律问答数据集的指令精调。

利用法律AI大模型定向训练金融普法及金融解纷智能体

z551646的博客

11-01

955

随着科技的飞速发展，人工智能在各个领域的应用不断拓展，智能体已经越来越深入应用于更为聚焦、具体的任务处理中。今天我们以金融治理中普法、解纷两个场景为例，探讨智能体在实践中的应用。全面加强监管、防范化解风险是目前金融工作的重点。

法律文书生成大模型（八）

m0_62512118的博客

06-22

695

为让所有人在遇到法律问题时能第一时间获得专业可靠的回答。结合了数据的共建、共训、共享，旨在实现普法资源的集成和优质普法成果的共享。本项目开源的中文法律通用模型由ChatGLM-6B LoRA 16-bit指令微调得到。数据集包括现有的法律问答数据集和基于法条和真实案例指导的self-Instruct构建的高质量法律文本问答，提高了通用语言大模型在法律领域的表现，提高了模型回答的可靠性和专业程度

法律文书生成大模型（三）

m0_62512118的博客

06-24

515

模型数据集准备

北京大学法律大模型——高质量数据、MoE架构、多智能体协同

Jamence的博客

12-19

1063

袁粒老师博士毕业于新加坡南洋理工大学，指导老师有颜水成（前昆仑万维首席科学家）、冯佳时（现字节豆包大模型视觉基础研究团队负责人），大模型人脉、资源非常不错。不仅如此，也是开源项目opensora的发起者。Chatlaw的整体流程非常复杂，需要构建图谱，多智能体协同。以图谱来说，知识图谱的构建成本很高，而且难以保证知识的实时性。然而，高成本却没有带来显著的性能提升，比较遗憾。但Chatlaw提出一种和用户交流、反馈的机制，非常具有启发性。

法律文书生成大模型（一）

m0_62512118的博客

06-24

617

故本项目实现的法律文本分析系统首先重新训练、再由ChatGLM-6B LoRA 16-bit指令微调得到。数据集包括现有的法律问答数据集、结合法条的实际司法实践中的案例所构建的高质量法律文本问答系统，目前已将大语言模型确定，此后还需要结合模型的问答输出结果将模型python接口与后端相连接。本小组的项目课题是针对2021级项目实训实施方案中的开题方向“面向法律文书的文本生成系统”，而在小组的项目计划中，课题实现则主要集中在案情分析和智能法条推荐方面，进而辅助法律文书的文本生成。

法律文书生成大模型（二）

m0_62512118的博客

06-24

1895

通过模型训练和微调，我们成功构建了一个针对法律领域的自然语言处理系统。该系统能够准确理解和生成法律文本，为法律专业人士提供高效的辅助工具。未来，我们将继续优化模型结构和训练策略，提高系统的性能和可靠性，以满足更广泛的应用需求。

法律文书生成大模型（六）

m0_62512118的博客

06-24

736

通过本次博客的介绍，我们了解了将基于大语言模型的法律意见提供及法律文书自动生成系统模型与后端连接的过程和操作。这一集成过程不仅实现了用户与模型的交互，还使得模型能够在实际法律场景中发挥作用。未来，我们将继续关注模型与后端集成的技术发展和最佳实践，以提供更加高效、准确和安全的法律服务。

北大开源ChatLaw：法律大模型MoE+RAG+图谱+多agent方案，提高准确性和效率，减少幻觉

2401_85379281的博客

12-17

923

基于大型语言模型（LLMs）的法律助手能够提供便捷的法律咨询服务，但幻觉问题可能带来潜在的法律风险。本文介绍了Chatlaw，这是一种创新的法律助手，利用专家混合（MoE）模型和多智能体系统来提高AI驱动的法律服务的可靠性和准确性。通过将知识图谱与人工筛选相结合，我们构建了高质量的法律数据集来训练MoE模型。此模型利用不同的专家来解决各种法律问题，从而优化法律回应的准确性。另外，模仿真实律师事务所工作流程的标准作业程序（SOP）显著减少了法律服务中的错误和幻觉。

RAG 基准测试（法律领域）测试数据集分享

Angus

09-16

2840

最近的一部分工作，有在做RAG的benchmark。年初三四月份（2024）的时候，调研已有的测试方案的时候，相关工作很少，只有一篇论文。最近再看相关的测试数据集又多了一些。我们虽然也有构建数据集，但是还是相对少一些。今天分享一篇论文，RAG关于法律领域的测试数据集。通常这种数据集需要一些领域知识，才能更好的更充分的构建出来这个数据集。实际上，评估RAG的能力，使用通用数据集是远远不够的。专门的领域测试数据集更权威和合理一些，更能够真实的反应RAG在实际使用场景中的能力。

面向法律领域的大模型微调与应用

h1453586413的博客

10-10

1133

*：**近年来，大语言模型在多个自然语言处理任务上展现出了出色的能力，为智慧法律系统的发展带来巨大的帮助。现有法律领域的大模型，通过微调通用大模型能够实现利用法律知识进行简单的问题回答，即大多以法律咨询问答为主，没有考虑到法律领域的其他使用场景，如法律信息抽取、判决预测等，而真实世界中的法律服务要比对话服务复杂得多。提出中文法律智慧大模型LawLLM，该模型可以面向不同用户群体，提供多样的法律服务。同时，探究了针对法律领域裁判文书的长文本信息抽取的应用。

法律文书生成大模型（十）

m0_62512118的博客

06-24

583

在深度学习领域，模型训练环境的搭建与配置是至关重要的一环。一个稳定、高效的训练环境不仅能够加速模型的训练过程，还能确保模型的质量。本文将详细介绍如何搭建和配置模型训练所需的软硬件环境，并探讨如何优化训练环境以提高效率。模型搭建回顾（该系列检查原模型搭建中的问题，同时为前后端开发做准备）

LaWGPT—基于中文法律知识的大模型

dzysunshine的博客

02-21

6172

知识问答数据集针对Self-Instruct的可靠性和安全性漏洞，使用了基于特定知识的Reliable-Self-Instruction：通过提供具体的法律知识文本，先让ChatGPT生成与该段法律知识内容与逻辑关系相关的若干问题，再通过“文本段-问题”对的方式让ChatGPT回答问题，从而使ChatGPT能够生成含有法律信息的回答，保证回答的准确性。：法律对话模型，构造 35w 高质量法律问答数据集，基于 Chinese-alpaca-plus-7B 指令精调后的模型。

深度学习速通系列:如何使用bert和crf进行法律文书脱敏

Ven%的博客

10-07

940

以上步骤详细介绍了如何使用BERT和CRF进行法律文书的脱敏处理，包括数据标注、预处理、模型微调、评估、导出和使用模型等环节。每一步都可以根据实际需求进行调整，以便更好地满足特定的应用场景。

深度学习-大模型LLM-微调经验分享&总结

记录学习的小白

06-02

2020

PT方法占用显存更大，因为也增加了很多而外参数;测试耗时，采用float16进行模型推理，由于其他方法均增加了额外参数，因此其他方法的推理耗时会比Freeze方法要高。当然由于是生成模型，所以生成的长度也会影响耗时;模型在指定任务上微调之后，并没有丧失原有能力，例如生成“帮我写个快排算法”，依然可以生成-快排代码;

干货！大模型时代一定要收藏的 20 个LLM 中文数据集