4.大模型微调技术LoRA

（initial）

已于 2024-06-12 20:39:21 修改

阅读量832

点赞数 11

分类专栏：大模型微调文章标签：语言模型

于 2024-06-10 07:00:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YPeng_Gao/article/details/139563039

版权

大模型微调专栏收录该内容

18 篇文章 2 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了低秩适配（LoRA）技术，它通过低秩矩阵A和B来模拟全参数微调，有效减少计算量和推理延迟。LoRA相比Adapter方法和Soft Prompts具有更高效、更深入的模型修改，同时AdaLoRA通过动态调整权重矩阵的本征秩以适应任务需求。QLoRA则提出4-bit NormalFloat (NF4)量化方法，实现大模型的高效微调。

摘要由CSDN通过智能技术生成

大模型低秩适配（LoRA）技术

现有PEFT 方法的局限与挑战

Adapter方法，通过增加模型深度而额外增加了模型推理延时。
Prompt Tuning、Prefix Tuning、P-Tuning等方法中的提示较难训练，同时缩短了模型可用的序列长度。
往往难以同时实现高效率和高质量，效果通常不及完全微调（full-finetuning）。
简而言之，尽管大模型参数规模巨大，但关键作用通常是由其中的低秩本质维度（lowintrinsic dimension）发挥的。
受此启发，微软提出了低秩适配（LoRA）方法，设计了特定结构，在涉及矩阵乘法的模块中引入两个低秩矩阵A和B以模拟完全微调过程。这相当于只对语言模型中起关键作用的低秩本质维度进行更新。

LoRA: 小模型有大智慧(2021)

请添加图片描述

为了使微调更加高效，LoRA的方法是通过低秩分解将权重更新表示为两个较小的矩阵（称为更新矩阵）。这些新矩阵可以在适应新数据的同时保持整体变化数量较少进行训练。<

了解本专栏

超级会员免费看

关注

11
点赞
踩
23

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

（initial） 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。