大模型参数高效微调技术原理综述之 LoRA、AdaLoRA、QLoRA

最新推荐文章于 2024-07-16 19:00:05 发布

u013250861

最新推荐文章于 2024-07-16 19:00:05 发布

阅读量646

点赞数

分类专栏： # LLM/预训练&SFT 文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/132073737

版权

LLM/预训练&SFT 专栏收录该内容

84 篇文章 85 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了大模型参数高效微调的三种技术——LoRA、AdaLoRA和QLoRA，旨在解决大模型微调的资源消耗问题。LoRA通过低秩分解模拟参数变化，AdaLoRA动态分配参数预算以适应权重矩阵的重要性，QLoRA实现了4 bit量化模型的高效微调。这些方法在减少参数量的同时保持或提高模型性能。

摘要由CSDN通过智能技术生成

随着，ChatGPT 迅速爆火，引发了大模型的时代变革。然而对于普通大众来说，进行大模型的预训练或者全量微调遥不可及。由此，催生了各种参数高效微调技术，让科研人员或者普通开发者有机会尝试微调大模型。

因此，该技术值得我们进行深入分析其背后的机理，本系列大体分七篇文章进行讲解。

大模型参数高效微调技术原理综述（一）-背景、参数高效微调简介
大模型参数高效微调技术原理综述（二）-BitFit、Prefix Tuning、Prompt Tuning
大模型参数高效微调技术原理综述（三）-P-Tuning、P-Tuning v2
大模型参数高效微调技术原理综述（四）-Adapter Tuning及其变体
大模型参数高效微调技术原理综述（五）-LoRA、AdaLoRA、QLoRA

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。