【膳逸】ChatGLM3-6B大模型loar微调3

weixin_65908894

已于 2024-06-24 13:56:38 修改

阅读量218

点赞数 1

文章标签：深度学习

于 2024-06-24 10:13:42 首次发布

本文链接：https://blog.csdn.net/weixin_65908894/article/details/139916772

版权

微调步骤

在Autodl云平台创建实例，运行LLaMA-Factory，如下图所示，在http://127.0.0.0:6006运行，打开微调页面。

在数据集文件中进行配置，将前面预处理后的数据集配置到微调项目的data当中，选中即可进行数据集的相关预览。设置学习率、训练轮数、最大梯度范围、最大样本数，之后开始训练。

微调效果

最后的微调效果是会将问题更加的细化，并且回答得更加偏向专业领域。

性能提升

	lora微调前	lora微调后
准确率	73.2%	89.4%
召回率	70.1%	88.2%
F1分数	66.7%	83.3%

在未进行微调时，ChatGLM3-6B的准确率为73.2%，召回率为70.1%，F1分数为66.7%。而在进行lora微调后，准确率提高到了89.4%，召回率提高到了88.2%，F1分数提高到了83.3%。这些数据表明，通过lora微调，ChatGLM3-6B在多个指标上均取得了显著提升。

其次，分析一下微调过程中学习率和批次大小的变化。在微调初期，我们设定学习率为0.01，批次大小为32。随着训练的进行，学习率逐渐减小，而批次大小则逐渐增大。在训练后期，学习率降至0.001，批次大小增至128。这种变化有助于模型在训练过程中更好地探索数据空间，从而找到更优的性能参数。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_65908894

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

loar sx1280 E28-2G4M STM32demo.rar

07-25

项目中用到了亿佰特E28系列的lora模块，目前针对E28模块的demo非常少，所以结合sx1280官方demo和网上各位大神的思路后进行整理，方便学习使用。主控芯片使用的是STM32F4系列，引脚连接在readme中有详细描述。...

从零开始写ChatGLM大模型的微调代码

lht0909的博客

04-25

2290

cursor 的下载及安装（免费版每月100次，升级pro 20刀/月）cursor是一款与openai合作的，使用gpt-4的一款编程工具，它可以让你通过gpt-4进行辅助编程，以此提高效率。下载地址：https://www.cursor.so/ cursor的使用cursor的使用方式极其简易，只有两个快捷键，即ctrl+k\ctrl+l。 ctrl+k 表单形式使用按快捷键：ctrl+k弹出输入框，输入你所需要写的代码要求及技术按回车即可。如下图。程序将自己生成代码： ctrl+l 对话框形式使

参与评论您还未登录，请先登录后发表或查看评论

ChatGLM两代的部署/微调/实现：从基座GLM、ChatGLM的LoRA/P-Tuning微调、6B源码解读到ChatGLM2的微调与实现

最新发布

京东科技开发者

08-13

1058

paper：LORA（Low-Rank Adaptation of Large Language Models）微调方法：冻结预训练好的模型权重参数，在冻结原模型参数的情况下，通过往模型中加入额外的网络层，并只训练这些新增的网络层参数。LoRA 的思想：•在原始 PLM (Pre-trained Language Model) 旁边增加一个旁路，做一个降维再升维的操作。•训练的时候固定 PLM 的参数，只训练降维矩阵A与升维矩B。而模型的输入输出维度不变，输出时将BA与 PLM 的参数叠加。

【Instruction Tuning】ChatGLM 微调实战（附源码）

人工智能曾小健

06-14

3183

Instruction Tuning 来微调一个监督学习模型排序序列来训练一个打分模型前两篇文章主要对 RM 和 RL 两部分进行了讲解和实验，但无数的经验向我们证明 —— 拥有一个好的 SFT 的模型对后两步的训练至关重要。由于在 RL 训练过程中会加入与 SFT 模型的相似度（KL-Divergence）惩罚，这意味着 RL 模型的上限很大程度上取决于 SFT 模型。为此，我们今天来重点讲一讲如何通过 ChatGLM 来微调一个读懂我们指令的模型。

（二）ChatGLM-6B模型部署以及ptuning微调详细教程

西风瘦马

04-09

2万+

ChatGLM-6B模型训练，ptuning微调，大语言模型，LLM

ChatGLM-6B的P-Tuning微调详细步骤及结果验证

scorpio的博客

04-26

1万+

ChatGLM-6B的P-Tuning微调详细步骤及结果验证

大模型笔记之-ChatGLM2微调（基于Windows10 22H2+RTX2080ti 实现）

JunHowie的个人Blog

11-03

3351

本文仅仅简单介绍了如何在Windows环境下微调及使用ChatGLM2-6B

chatGML 训练测试数据

10-13

这个压缩包文件“checkpoint-1000”很可能包含了训练一个基于ChatGML的对话模型的重要资源，特别是当模型在训练过程中的第1000个检查点时的数据保存。训练测试数据是机器学习过程的关键组成部分，它被用来评估模型在...

基于loar的智能温度控制系统

04-26

3. STM32微控制器：作为系统的大脑，STM32系列微控制器具备高性能、低功耗的优势，能处理传感器数据并控制LoRa模块进行通信。二、工作流程 1. 数据采集：DHT11传感器持续检测环境的温度和湿度，并将数据送至STM32...

cc1200-中英文手册，CC1200 低功率、高性能射频 (RF) 收发器，Sub-1 GHz RF Trans类比lora

08-16

cc1200_中英文手册，CC1200 低功率、高性能射频 (RF) 收发器，Sub-1 GHz RF Trans类比lora 1.1 特性 1 • RF 性能和模拟特性： • 数字特性： – 高性能、单芯片收发器 – 波形监视：针对经改进同步检测性能的...

基于LoRa的矿用无线通信系统设计-论文

07-08

为解决传统煤矿监控系统传感层有线总线通信节点容量少、通信距离短、布线成本高等问题,设计了一种基于LoRa的矿用无线传感层通信系统,实现监控区域网络全覆盖。详细介绍了系统网关和终端通信模块设计,终端入网机制,...

ChatGLM-6B 的部署与微调以及过程中涉及知识总结(7.26更新)

fireshark

06-13

5036

最近因为工作关系，接触到ChatGLM-6B，自己部署做了一些测试。参考了网上很多优秀的资料，在此基础上，补充一些自己实践中发现的细节。部署内容部分绝大部分来自：https://zhuanlan.zhihu.com/p/627168140微调部分借鉴：https://zhuanlan.zhihu.com/p/625468667细节问题参考：https://zhuanlan.zhihu.com/p/624918286！

ChatGLM 微调实战

AI生成式技术曾小健

05-26

2694

通过排序序列前两篇文章主要对 RM 和 RL 两部分进行了讲解和实验，但无数的经验向我们证明 —— 拥有一个好的 SFT 的模型对后两步的训练至关重要。由于在 RL 训练过程中会加入与 SFT 模型的相似度（KL-Divergence）惩罚，这意味着 RL 模型的上限很大程度上取决于 SFT 模型。为此，我们今天来重点讲一讲如何通过 ChatGLM 来微调一个读懂我们指令的模型。

学习实践ChatGLM-6B（部署+运行+微调）

LZL2020LZL的博客

04-07

1万+

该模型基于 General Language Model (GLM) 架构，具有 62 亿参数。注：结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。ChatGLM-6B可以实现的能力这是一个对话机器人，所以基本的问答，系统都支持。自我认知提纲写作文案写作邮件助手信息抽取角色扮演评论比较旅游向导。

chatGLM3微调

huiguo_的博客

11-22

4792

大模型摘要微调

基于ChatGLM的微调实现

夏栀的博客

07-15

2013

下面描述具体的实现过程。

GPT实战系列-ChatGLM2模型的微调训练参数解读

Alex_StarSky的博客

10-31

4601

ChatGLM-6B是开源的文本生成式对话模型，基于General Language Model(GLM)框架，具有62亿参数，FP16 半精度下，ChatGLM-6B 需要 13GB 左右的显存进行推理。文章对P-Tuning的训练参数进行详细解读，有助于微调、训练的顺利开展。

【官方教程】ChatGLM-6B 微调，最低只需 7GB 显存

AITIME_HY的博客

04-02

8923

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入！内容来自：GLM大模型自3月14日开源以来，ChatGLM-6B 模型广受各位开发者关注。截止目前仅 Huggingface 平台已经有 32w+ 下载，Github Star 数量超过11k。为了促进 ChatGLM-6B 模型在各垂直领域的应用，我们现推出基于 P-Tuning v2 的微调方案。P-Tuning v2 将需要微调的参...

loar树状组网的C代码流程图

04-04

抱歉，我作为语言模型无法提供代码的流程图。但是，我可以为您提供一些关于LOAR树状组网的C代码实现的一般步骤： 1. 定义LOAR结构体，包含节点ID，父节点ID和子节点ID数组； 2. 初始化LOAR结构体，设置根节点的ID和...