项目模型文档 - 模型选择
- 模型介绍
- 对比选择
- 模型准备
模型选择
本小组的项目课题是针对2021级项目实训实施方案中的开题方向“面向法律文书的文本生成系统”,而在小组的项目计划中,课题实现则主要集中在案情分析和智能法条推荐方面,进而辅助法律文书的文本生成。
经过测试,例如清华技术成果转化的ChatGLM无法实现具体的法条推荐功能,而openAI的GPT大模型,由于国内外的差异,反而不符合国人的法律需求。
故本项目实现的法律文本分析系统首先重新训练、再由ChatGLM-6B LoRA 16-bit指令微调得到。数据集包括现有的法律问答数据集、结合法条的实际司法实践中的案例所构建的高质量法律文本问答系统,目前已将大语言模型确定,此后还需要结合模型的问答输出结果将模型python接口与后端相连接。
在模型框架搭建的时候选择ChatGLM而不是更高版本的ChatGLM2,来作为您法律意见提供及法律文书自动生成系统的框架模型时,主要原因如下:
- 模型稳定性与成熟度:
- ChatGLM作为较早推出的模型,已经经过了相对较长时间的实际应用和用户反馈的检验,因此在模型稳定性和成熟度方面可能具有优势。
- ChatGLM2虽然作为升级版在性能上有所提升,但可能还在不断迭代和优化中,可能存在一定的不稳定性和未知风险。
- 适配性与定制性:
- 在法律领域,系统的准确性和专业性至关重要。ChatGLM作为一个成熟的模型,可能已经有一些针对法律领域的适配和定制工作,能够更好地满足您的需求。
- ChatGLM2作为较新的模型,可能需要更多的时间和资源来进行针对法律领域的适配和定制。
- 推理速度与效率:
- 虽然ChatGLM2在模型规模上有所扩大,并在某些数据集上取得了更好的性能,但这可能意味着推理速度和效率相对较慢。
- 在法律文书生成和法律意见提供的场景中,往往需要快速响应用户需求,因此ChatGLM在推理速度和效率上的优势可能更加适合您的系统需求。
- 成本考虑:
- ChatGLM作为较早推出的模型,其相关的训练数据和资源可能更加丰富和便宜,从而降低了系统的整体成本。
- ChatGLM2作为较新的模型,可能需要更多的计算资源和训练数据来支持其运行,这可能会增加系统的成本。
- 技术支持与社区资源:
- ChatGLM作为一个成熟的模型,可能拥有更加完善的技术支持和丰富的社区资源,这将有助于您在开发过程中获得更好的帮助和支持。
- ChatGLM2作为较新的模型,可能在技术支持和社区资源方面相对较少,这可能会增加您在开发过程中遇到问题的难度。