LoRA(Low-Rank Adaptation)模型核心基础知识

最新推荐文章于 2025-04-14 18:58:57 发布

丁希希哇

最新推荐文章于 2025-04-14 18:58:57 发布

阅读量2.4k

点赞数 19

分类专栏： AIGC阅读学习文章标签：人工智能 AIGC 深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47748259/article/details/135537859

版权

AIGC阅读学习专栏收录该内容

39 篇文章

订阅专栏

文章目录

一、LoRA模型的概念
二、LoRA模型的核心原理
- （一）LoRA模型的训练逻辑
- （二）LoRA的参数合并方式

一、LoRA模型的概念

LoRA的全称：Low-Rank Adaptation of Large Language Models，是一种微调模型，可以理解为stable diffusion模型的一种插件，用于满足一种特定的风格，或指定的人物特征属性；
我们可以使用SD模型+LoRA微调训练的方式，只训练参数量很小的LoRA模型，就能在下游细分任务中取得不错的效果；
LoRA大幅降低了SD模型训练时的显存占用，因为并不优化主模型（SD模型），所以主模型对应的优化器参数不需要存储。但计算量没有明显变化，因为LoRA是在主模型的全参梯度基础上增加了“残差”梯度，同时节省了主模型优化器更新权重的过程。

二、LoRA模型的核心原理

（一）LoRA模型的训练逻辑

步骤一： 冻结训练好的SD模型的权重；
步骤二： 在SD模型的U-Net结构中注入LoRA模块，并将其与CrossAttention模块结合，并只对这部分参数进行微调训练；
步骤三： 训练好新的参数后，利用重参的方式，将新参数和老的模型参数合并。

在这里插入图片描述

（二）LoRA的参数合并方式

对于SD模型权重 $W_0 \in \mathbb{R}^{n\times m}$ ，我们不再对其进行全参微调训练，而是对权重加入残差的形式，通过训练 $\Delta W$ 来完成优化过程：
$W^{'} =W_0+\Delta W$
其中 $\Delta W=AB^T$ ， $A\in \mathbb{R}^{n\times d}$ ， $B\in \mathbb{R}^{d\times m}$ ， $d$ 就是 $\Delta W$ 这个参数矩阵的秩，其通过低秩分解由两个低秩矩阵的乘积组成。由于下游细分任务的域非常小，所以d可以取得很小，很多时候可以取1。因此，在训练完成后，可以获得一个参数远小于SD模型的LoRA模型。

假设原来的是100x1024的参数矩阵，那么参数量为102400，LoRA模型将矩阵拆成了两个矩阵相乘，如果设置Rank=8，那么就是100x8的B矩阵与8x1024的A矩阵做矩阵乘法，参数量为800+8192=8992，整体参数量下降了约11.39倍。

在这里插入图片描述
矩阵乘积 $AB^T$ 与SD模型的参数有相同的维度，同时分解出来的两个较小矩阵可以确保参数更新是在低秩情况下的，这样就显著减少训练的参数数量了。

对于矩阵A：使用随机高斯分布初始化
对于矩阵B：使用全0初始化
初始状态下这两个矩阵相乘的结果为0，从而保证初始阶段时只有SD模型（主模型）生效

参考：
深入浅出完整解析LoRA(Low-Rank Adaptation)模型核心基础知识
 什么是LoRA模型，如何使用和训练LoRA模型？你想要的都在这！
图像生成：SD LoRA模型详解

博客等级

码龄5年

176
原创

4475
点赞

4800
收藏

3222
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

【论文精读】CLIP 改进工作（LSeg、GroupViT、VLiD、 GLIPv1、 GLIPv2、CLIPasso、CLIP4clip、ActionCLIP）
就叫潇洒哥: 博主有没有vild的实际配置文件路径这个文件vild_resnet50_fpn_coco.yaml
【论文精读】The Stable Signature: Rooting Watermarks in Latent Diffusion Models 稳定的签名：潜在扩散模型中的根水印
bupt_01: 可以交流下吗，我也是研究这个的
huggingface学习|用dreambooth和lora对stable diffusion模型进行微调
m0_74433432: Traceback (most recent call last): File "train_text_to_image_lora.py", line 975, in <module> main() File "train_text_to_image_lora.py", line 526, in main unet.to(accelerator.device, dtype=weight_dtype) File "/home/xyj/anaconda3/envs/sdLoRA/lib/python3.8/site-packages/diffusers/models/modeling_utils.py", line 1341, in to return super().to(*args, **kwargs) File "/home/xyj/anaconda3/envs/sdLoRA/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1174, in to return self._apply(convert) File "/home/xyj/anaconda3/envs/sdLoRA/lib/python3.8/site-packages/torch/nn/modules/module.py", line 780, in _apply module._apply(fn) File "/home/xyj/anaconda3/envs/sdLoRA/lib/python3.8/site-packages/torch/nn/modules/module.py", line 780, in _apply module._apply(fn) File "/home/xyj/anaconda3/envs/sdLoRA/lib/python3.8/site-packages/torch/nn/modules/module.py", line 780, in _apply module._apply(fn) [Previous line repeated 6 more times] File "/home/xyj/anac
huggingface学习|用dreambooth和lora对stable diffusion模型进行微调
m0_74433432: 为啥按照你的lora流程我的会报错呀，不是环境问题代码逻辑问题
huggingface学习|云服务器部署Grounded-Segment-Anything：bug总会一个一个一个一个又一个的解决的
老冥灵: https://github.com/IDEA-Research/Grounded-Segment-Anything/issues/479 把几个语句注释掉应该就行了

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。