【LLM】大语言模型高效微调方案Lora||直击底层逻辑

思考实践

已于 2023-11-04 00:18:13 修改

阅读量869

点赞数 1

分类专栏： LLM 文章标签：语言模型人工智能自然语言处理 Lora 高效微调 ChatGLm

于 2023-11-02 16:07:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43332715/article/details/134185024

版权

LLM 专栏收录该内容

36 篇文章

订阅专栏

大白话:

DL的本质就是矩阵的乘法，就能实现LLM,

假设两个矩阵都很大，一个mxn,一个nxd的矩阵，m,n,d这几个数字可能几千甚至上万的场景，计算起来代价很大，如果我们可以small 这些数字，缩小到10甚至5这样的scenario，cost就非常的小。

训练的时候只训练右边橙色的AB矩阵

那么基于什么理论，我们可以这么搞呢？

目前看到讲解最好的博客，难怪点赞数也很高，细节都在里面，比如为什么要low-rank,理论基础是什么，并且还有发散，数学上的内容也比较友好。

【OpenLLM 006】LoRA:大模型的低秩适配-最近大火的lora到底是什么东西？为啥stable diffusion和开源ChatGPT复现都在用？ - 知乎 (zhihu.com)

Reference

深入浅出剖析 LoRA 技术原理_lora csdn-CSDN博客

【OpenLLM 006】LoRA:大模型的低秩适配-最近大火的lora到底是什么东西？为啥stable diffusion和开源ChatGPT复现都在用？ - 知乎 (zhihu.com)

PaperReading-“Intrinsic Dimension” - 知乎 (zhihu.com) //中科大少年班的孩子写的，挺不错的

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。