自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 基于streamlit开发法律文书生成以及聊天界面

Streamlit是一个开放源代码的Python库,旨在帮助数据科学家和开发者快速构建并分享具有吸引力的交互式Web应用。这个工具特别适合那些没有前端开发背景的用户,使他们能够轻松地将数据脚本转化为可供非技术用户使用的交互式Web应用。Streamlit极大地简化了Web应用的开发流程,允许开发者将精力集中在数据处理和业务逻辑上,而非界面设计。它的核心设计理念是高效简洁,通过大幅减少模板代码的需求,让创建基于数据的应用变得异常简便。

2024-06-23 21:43:15 405

原创 法律文书——调解书构造

用户在调解书生成功能模块给出自己经历的事实和理由,并表达自己的诉讼意愿,并且期望模型给出内容合理的调解意见,为了便于用户阅读,我们期望生成格式规范并且内容合理的调解书,为此我们定下了一系列微调数据构造要求,希望以此提高模型在这方面的性能和输出习惯。

2024-06-23 20:33:46 394

原创 基于 ChatGLM3 和 LangChain 搭建-前端搭建

函数主要用于处理和裁剪 Streamlit 会话状态中保存的用户对话历史,以确保生成的提示字符串适合模型处理,不超过450字符。函数首先检查会话中是否已记录消息,然后构建历史记录列表,其中每条记录包含一问一答。这样做是为了优化模型的输入,并确保聊天机器人能够有效地处理并响应用户的当前输入。最后,根据裁剪结果更新历史记录,并返回这个更新后的列表。当输入任意关键字时,使用距离计算函数估计相似度,用户可自行切换距离计算函数的算法。获取用户输入,然后使用聊天机器人的预测方法生成回答,并通过。

2024-06-23 20:19:22 283

原创 基于 ChatGLM3 和 LangChain 搭建知识库

LangChain 是一个开源库,专为构建语言模型代理而设计,使开发者能够轻松集成和控制大型语言模型,如 OpenAI 的 GPT。LangChain 提供了一系列工具和框架,支持多种功能,包括但不限于聊天机器人、问答系统和自动化文本生成。")构造函数初始化了嵌入模型、嵌入向量数据库、文本数据库和其他相关属性。这为文档处理和查询提供了基础。

2024-06-23 18:49:11 453

原创 山东大学软件学院项目实训项目_大模型训练

里面描述的构建数据集的方法,再结合网络上开源的法考数据集,通过LLaMA-Factory对模型进行lora微调,使其具备了一定的法律知识。这里验证集的比例设定为0.04;训练轮数设定为3轮;最大样本数设定为100000;截断长度设置为1024;批处理大小设置为2。

2024-05-30 20:45:27 207

原创 ChatGLM3-6B大模型部署、微调流程记录

随着人工智能技术的飞速进步,机器学习已然成为推动科技进步和产业变革的关键力量。大型预训练模型如ChatGlm3-6B的崛起,为智能对话系统、文本生成等应用提供了强大的技术支撑。本文旨在详细介绍ChatGlm3-6B大模型的部署及微调流程,以期为相关研究人员和开发者提供参考和指导。

2024-05-30 15:55:04 392 1

原创 法律文书数据集构建

此外,我们的目标是:使模型能够在生成判决文书时,不仅仅是模拟法律文书的格式和语言风格,而是更深层次地理解和引用相应的法律依据。此外,这种数据驱动的方法将极大提升模型在法律预测和应用中的准确性,从而提供更为专业和精确的法律服务,支持法律决策过程,增强法律系统的效率和公正性。我们决定选取全国各个地区(江苏,安徽,陕西,山西,浙江,上海,山东,河南)每个地区七十条一审刑事判决书的犯罪事实和判决结果。为了构建一个高效且准确的法律大模型,特别是用于自动生成法律文书,我们需要收集和整理一个全面的法律数据集。

2024-05-30 10:47:11 182

原创 山东大学软件学院项目实训项目_大模型自我认知数据集的构建

/input(自我认知一般涉及不到): str, optional context or input for the task. For example, when the instruction is "Summarize the following article", the input is the article.//你能生成民事裁定书/判决书/合同吗?你能生成什么类型的文书?你是怎么训练/开发出来的。你能处理什么法律领域?你是Chatglm吗?与其他AI有什么不同。

2024-05-29 19:18:59 308

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除