LLaMA-Factory 微调LLaMA3

小枫@码

已于 2025-01-26 19:52:59 修改

阅读量930

点赞数 9

文章标签： llama 语言模型

于 2025-01-25 23:54:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wsq1011/article/details/145360288

版权

LoRA介绍

LoRA（Low-Rank Adaptation）是一种用于大模型微调的技术，通过引入低秩矩阵来减少微调时的参数量。在预训练的模型中， LoRA通过添加两个小矩阵B和A来近似原始的大矩阵ΔW，从而减少需要更新的参数数量。具体来说，LoRA通过将全参微调的增量参数矩阵ΔW表示为两个参数量更小的矩阵B和A的低秩近似来实现：

• [ W_0 + \Delta W = W_0 + BA ] • 其中，B和A的秩远小于原始矩阵的秩，从而大大减少了需要更新的参数数量。

LLaMA-Factory 框架

首先需要通过vscode连接远程服务器哦

如果是租赁的AutoDL服务器，一定要将模型下载到数据盘。

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .

准备训练数据

训练数据： fintech.json identity.json 将训练数据放在 LLaMA-Factory/data/fintech.json

并且修改数据注册文件：LLaMA-Factory/data/dataset_info.json

 "fintech": {
 "file_name": "fintech.json",
 "columns": {
 "prompt": "instruction",
 "query": "input",
 "response": "output",
 "history": "history"
 }
 }

启动 Web UI

cd LLaMA-Factory

llamafactory-cli webui

vscode自带端口转发，不需要进行内网穿透了。

一定要在LLaMA-Factory 目录下启动。

模型准备

pip install modelscop #安装modelscope平台

sdk方式下载模型，同时可以查看模型整体的大小和权重。

模型微调，微调 Llama-3.2-1B-Instruct 模型

博客等级

码龄8年

49
原创

688
点赞

685
收藏

850
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Llama3的本地部署与调用测试

下一篇：: 大模型正确调用方式

最新评论

HBase内存配置及JVM优化
CSDN-Ada助手: 非常感谢您的分享，第10篇博客内容非常实用，特别是对于HBase内存配置及JVM优化的详细解析，让我受益匪浅。祝贺您能够坚持不懈地创作，希望您能够继续保持良好的创作状态，分享更多优质的技术文章，让更多的人受益。建议您可以多关注行业热点话题，分享您的见解与心得，期待您的下一篇作品。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
HBase内存配置及JVM优化
CSDN-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: Microsoft Edge功能测评！: https://activity.csdn.net/creatActivity?id=10403?utm_source=csdn_ai_ada_redpacket 无效数据，你会怎么处理？: https://activity.csdn.net/creatActivity?id=10423?utm_source=csdn_ai_ada_redpacket 新人首创任务挑战赛: https://marketing.csdn.net/p/90a06697f3eae83aabea1e150f5be8a5?utm_source=csdn_ai_ada_redpacket 全部创作活动: https://mp.csdn.net/mp_blog/manage/creative?utm_source=csdn_ai_ada_redpacket
Hive的Metastore服务和Hiveserver2服务的说明
CSDN-Ada助手: 恭喜你写了一篇关于Hive的Metastore服务和Hiveserver2服务的说明的博客！这篇文章非常有价值，对于想要更深入了解Hive的人来说会非常有帮助。希望你能继续保持创作的热情，分享更多关于Hive的知识。下一步的创作建议是可以尝试分享一些实际使用Hive的案例，这样读者能够更好地理解Hive的用途和优势。再次感谢你的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
Kimball维度建模
CSDN-Ada助手: 恭喜您撰写了第9篇博客，标题“Kimball维度建模”。非常感谢您分享这个主题。您的文章很详细，我学到了很多新的知识。如果您想拓展主题，我建议您可以深入探讨在实践中如何应用Kimball维度建模。期待您的下一篇博客。再次感谢您的分享。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
ES集群规划
CSDN-Ada助手: 恭喜您写出了这篇关于ES集群规划的博客，对于想要学习ES的我来说非常有帮助。希望您能继续分享您的经验和心得，比如可以分享ES的实际应用场景或者对ES性能调优的一些技巧。期待您的下一篇博客。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。