新审视零阶优化在内存高效大模型微调中的应用

人工智能大模型讲师培训咨询叶梓

已于 2024-11-03 21:54:52 修改

阅读量1.1k

点赞数 10

分类专栏：人工智能文章标签：语言模型人工智能自然语言处理大模型微调性能优化 LLM优化

于 2024-08-27 19:30:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44292902/article/details/141564682

版权

人工智能咨询培训老师叶梓转载标明出处

随着大模型模型规模的增大，反向传播（BP）所需的内存开销也日益增加，这对内存效率提出了挑战。尤其是在设备上训练等内存效率至关重要的应用场景中，解决这一问题变得尤为迫切。

本文提出了一种新的方法，即在LLM微调过程中，采用零阶（Zeroth-Order, ZO）优化算法替代传统的需要反向传播的一阶（First-Order, FO）优化算法，以降低内存成本。这种BP-free的优化方法基于Malladi等人在2023年提出的初始概念。

论文地址：https://arxiv.org/abs/2402.11592

项目地址：https://github.com/ZO-Bench/ZO-LLM

方法

ZO优化作为一种不依赖梯度信息的替代方法，通过基于函数值的梯度估计来近似传统的一阶梯度。这种方法通常反映了其对应的一阶优化算法的算法框架，但它用ZO梯度估计替换了FO梯度作为下降方向。文中特别关注了随机梯度估计器（Randomized Gradient Estimator, RGE），这是一种依赖于沿随机选择的方向向量的函数值的有限差分的方法。

RGE的数学表达式，用来近似函数在点x处的梯度：这里，是从标准高斯分布

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

人工智能大模型讲师培训咨询叶梓 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。