Full-Parameter全参数微调与LoRA低秩微调

u013250861

已于 2023-06-17 10:18:49 修改

阅读量739

点赞数

分类专栏： # LLM/预训练&SFT 文章标签：人工智能深度学习机器学习

于 2023-06-13 21:18:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/131196559

版权

LLM/预训练&SFT 专栏收录该内容

84 篇文章 67 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

近年来，大型语言模型的指令微调是自然语言处理领域的一个重要研究领域。
由于资源和成本的限制，一些研究人员采用了参数有效的调整技术，如LoRA，并取得了不错的结果。与全参数微调相比，基于LoRA的微调在训练成本方面表现出显著的优势。针对这类问题，本文介绍一篇关于全监督微调和lora微调的对比评估工作：

该工作主要对比了全参数微调和Lora微调的对比，这对后续SFT模型微调有一定的参考意义。具体地，该工作利用LLaMA作为基本模型，对全参数微调和基于LoRA的微调方法进行了实验比较，实验结果表明，基础模型的选择、训练数据集规模、可学习参数数量和模型训练成本都是重要因素。供大家一起参考。

一、工作背景

目前，有几个开源的大型语言模型已经对教学数据进行了微调，包括OPT（Zhang等人，2022）、BLOOM（Workshop等人，2022。这些模型在一系列语言任务中表现出了卓越的性能，从而强调了指令微调在提高语言模型性能方面的潜在好处。

在

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Full-Parameter全参数微调与LoRA低秩微调

该工作使用LLaMA作为基本模型，对全参数微调和基于LoRA的微调方法进行了实验比较，并探讨了不同数量的训练数据和模型参数对基于LoRA的调整有效性的影响。从实验结果的比较中，可以观察到一些有趣的结论：1、基础模型的选择对基于LoRA的调谐的有效性有显著影响。这表明基础模型的选择对基于LoRA的微调方法的有效性至关重要。2、增加训练数据的数量可以不断提高模型的有效性。3、基于LoRA的调整得益于模型参数的数量。当前，在实际的业务工作中，需要具体业务具体分析。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。