LoRA微调模型结构可训参数和配置详解

weixin_42924890

已于 2024-09-22 11:38:32 修改

阅读量1.6k

点赞数 32

分类专栏： LoRA 文章标签： python 深度学习神经网络自然语言处理

于 2024-09-07 11:22:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42924890/article/details/141992660

版权

LoRA微调模型结构可训参数和配置详解

背景

上一篇主要整理了一些关于LoRA的知识点总结，本文则主要从以下几方面继续学习分析LoRA微调策略。上篇 LoRA常见知识点。

测试内容和代码

1、构建一个简单的两层线性网络，加relu激活函数，在第一层Linear中使用LoRA策略，打印看下模型结构。复习Lora在第一层Linear网络的结构，即在第一层旁增加Lora策略。

2、打印原始网络结构中可训练的参数和LoRA策略下的参数量。

3、LoraConfig类的一些参数解释。

整体代码如下：

import torch
import torch.nn as nn
from peft import get_peft_model, LoraConfig


# 定义基础模型
class SimpleMLP(nn.Module):
    def __init__(self):
        super(SimpleMLP, self).__init__()
        self.fc1 = nn.Linear(10, 20)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(20, 2)

    def forward(self, x):
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x

def count_parameters(model):
    """计算可训练的参数"""
    for name, param in model.named_parameters():
        if param.requires_grad:
            # 打印具体的参数名称和形状
            print(f"{
     name}: {
     param.size()}")
    # 可训练参数总量
    return sum(p.numel(

最低0.47元/天解锁文章

weixin_42924890

博客等级

码龄7年

73
原创

834
点赞

677
收藏

553
粉丝

关注

私信

热门文章

分类专栏

机器学习 11篇
一些感悟 1篇
LLM 11篇
python 14篇
Bert 3篇
Docker 1篇
Torch
Transformer
LoRA 4篇
numpy 1篇
Git 1篇
mysql 1篇
pandas 3篇
matplotlib 2篇

最新评论

LoRA基于BERT模型微调实践
江洛白: 为什么Lora微调后准确度变成0.11了
LoRA基于BERT模型微调实践
PhoenixYear: 感谢作者大大分享，Github上的项目已经加星了。不过有一点需要提醒，开源项目里的model_train_lora.py内容是空的，由于博客里有源代码，拷贝后是可以运行的。另外，如果大家想输出训练日志，需要在TraningArguments里加一项配置：report_to="tensorboard"，这样就可以用Tensorboard观察训练状态了。
LoRA训练推理部署流程
shuoyes123: 感谢博主，讲解真的是掰开了，揉碎了。
python可用于生产级别的日志模块
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
matplotlib绘图二
普通网友: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。