LoRA是如何更新参数的

原创已于 2025-11-04 14:13:16 修改 · 184 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #机器学习 #人工智能

于 2025-11-04 11:30:40 首次发布

1、本质上，还是反向传播算法

在前向过程中，代入A、B的参数算出损失的

在反向过程，根据损失求导算法A，B参数的梯度，然后更新参数

2、核心公式

通过一个低秩增量 $\Delta W$ 来调整预训练模型的原始权重 $W$ ，而不是直接修改 $W$ 本身。它的核心公式可以简单写成：

$Weff=W+\Delta W=W+A\times B$

W：预训练原始权重（冻结，不更新）

$\Delta W$ ：引入的低秩增量（dxk）

A：dxr矩阵，r $\ll$ d,k

B: rxk矩阵

LoRA有哪些改进版本？

（1）LoRA+

目标：加速训练

基础：标准LoRA的升级

改进点：对A和B设置不同学习率，B的学习率远高于A的学习率

理论依据：靠近输出的权重对梯度更敏感，需要大调整；输入侧应更稳定

优点：训练速度提升（最高达2倍），性能比标准LoRA高1%~3%

总结：

LoRA作为一种高效的大模型微调技术，通过低秩矩阵分解大幅降低参数量和计算资源要求，同时保持接近全微调的性能。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。