LoRA原理解析

骚火棍

已于 2023-09-06 13:13:27 修改

阅读量856

点赞数

分类专栏： AIGC 文章标签：人工智能

于 2023-06-09 17:25:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Galen_xia/article/details/131131313

版权

AIGC 专栏收录该内容

4 篇文章

订阅专栏

1、LoRA(Low-Rank Adaptation of Large Language Models)是什么？

LoRA 的全称是 “Low-Rank Adaption”，看到 “low-rank”，线性代数玩家们应该会神经反射性地联系到低秩矩阵。Binggo! 这里就是这个意思。你问我 LoRA 的中文名？Em… 就叫它“低秩(自)适应”吧，虽然英文里没有 “self”，但根据 LoRA 的思想和做法及其带来的效果，它就是自适应的意思。概括地来说，LoRA 是一项主要用于微调 LLMs 的技术，它额外引入了可训练的低秩分解矩阵，同时固定住预训练权重。这个玩法的重点在于：预训练权重不需训练，因此没有梯度，仅训练低秩矩阵那部分的参数。

2、LoRA灵感来源

作者在 paper 中提到：以往的一些工作表明，模型通常是过参数化(over-parametrized的，它们在优化过程中参数更新的部分通常“驻扎”(reside)在低维子空间中。基于此，作者就顺理成章地提出假设：预训练模型在下游任务中微调而更新参数时，也符合这样的规律。

3、LoRA是如何做的？

在这里插入图片描述

引入低秩矩阵

参考链接：https://mp.weixin.qq.com/s/3FpXXewXXW8qy3zEzk9aXg

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。