大模型微调过程随记

m0_65156252

已于 2024-03-23 18:32:04 修改

阅读量148

点赞数 2

文章标签： python 语言模型自然语言处理

于 2024-03-22 19:13:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_65156252/article/details/136931007

版权

本文介绍了如何在Nootbook中使用PyTorch运行模型，探讨了Qwen模型的开源实现及其社区支持，涉及RAG在增强生成中的应用，以及LlamaIndex和LoRA/QLoRA等技术在降低大模型微调成本和提高准确性的角色。

摘要由CSDN通过智能技术生成

1，在nootbook中新建liuxia.ipynb文件，将内容复制进去点击运行，成功后会出现创建成功的chat.json文件

2，Qwen模型的开源仓库中，提供的示例代码就是基于PyTorch编写的。PyTorch是一个广泛使用的深度学习框架，它的易用性和灵活性都非常高，适合于各种类型的神经网络模型。

此外，PyTorch还有一个庞大的社区，提供了大量的教程和资源，可以帮助你快速上手并掌握PyTorch的使用。而且，PyTorch也支持GPU加速，可以大大提高模型训练的效率。

3，针对执行：bash finetune_qlora_single_gpu.sh出现的一个路径找不到问题，更换执行语句为：

python finetune.py \ --model_name_or_path Qwen-1_8B-Chat-Int4 \ --data_path chat.json \ ......

4，检索增强生成 (RAG) 是一种人工智能框架，用于通过将模型建立在外部知识源的基础上来补充 LLMs 的内部信息表示，从而提高 LLMs 生成的响应的质量。 RAG 是一种利用从外部来源获取的事实来提高生成式 AI 模型的准确性和可靠性的技术，它对大型语言模型输出进行优化，使其能够在生成响应之前引用训练数据来源之外的权威知识库。在基于 LLM 的问答系统中实施 RAG 有两个主要好处：1. 它确保模型能够访问最新、可靠的事实；2. 用户能够访问模型的来源，确保可以检查其声明的准确性和准确性，最终得到信任。

RAG 将信息检索组件与文本生成器模型相结合。 RAG 可以进行微调，并且可以有效地修改其内部知识，而无需重新训练整个模型。

5，LlamaIndex是一个用于连接大语言模型（LLMs）和外部数据源的数据框架，它可以让LLMs访问和利用私有或领域特定的数据。

6，大模型微调技术LoRA和QLoRA都是为了解决大规模模型微调成本高昂的问题而提出的。LoRA技术通过使用低精度权重降低了存储需求和计算成本，但在准确性上有所牺牲。而QLoRA技术则通过使用高精度权重和可学习低秩适配器，既降低了微调成本，又提高了模型的准确性。

7，模型微调的主要作用是在已经预训练好的模型基础上，通过进一步的训练来适应特定的任务或领域。

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
大模型微调过程随记

PyTorch是一个广泛使用的深度学习框架，它的易用性和灵活性都非常高，适合于各种类型的神经网络模型。此外，PyTorch还有一个庞大的社区，提供了大量的教程和资源，可以帮助你快速上手并掌握PyTorch的使用。4，检索增强生成 (RAG) 是一种人工智能框架，用于通过将模型建立在外部知识源的基础上来补充 LLMs 的内部信息表示，从而提高 LLMs 生成的响应的质量。5，LlamaIndex是一个用于连接大语言模型（LLMs）和外部数据源的数据框架，它可以让LLMs访问和利用私有或领域特定的数据。
复制链接

扫一扫

m0_65156252 CSDN认证博客专家 CSDN认证企业博客

码龄3年

4: 原创

152万+: 周排名

15万+: 总排名

3576: 访问

: 等级

102: 积分

36: 粉丝

41: 获赞

3: 评论

60: 收藏

私信

关注

热门文章

最新评论

文献+论文+综述
CSDN-Ada助手: 恭喜用户在博客上发布了新的一篇文章，“文献+论文+综述”。持续创作不易，你的努力和热情让读者受益匪浅。接下来，我建议你可以尝试深入挖掘文献内容，结合自己的观点和思考，写出更具深度和独特性的综述文章。期待你的下一篇作品！继续加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
ChatGLM3-6B部署+高效微调
CSDN-Ada助手: 非常感谢您分享这篇博文！您的部署和微调方法非常详细，让读者能够轻松跟随操作。希望您能继续分享更多关于ChatGLM3-6B的知识和经验，让更多人受益。在微调模型的过程中，您可以尝试使用不同的学习率、批量大小和训练轮数等超参数，以优化模型性能。另外，尝试使用不同的预处理技术，如词嵌入和数据增强，也可以提升模型的表现。希望这些扩展知识对您有所帮助！期待您的下一篇博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
大模型相关知识学习随记
CSDN-Ada助手: 恭喜你开始了博客创作的第一步！学习大模型相关知识是一个很好的选择，也是一个挑战。希望你能坚持不懈地学习和积累经验，不断提升自己的写作能力。下一步可以尝试深入研究大模型的具体应用领域，结合实际案例进行分析和探讨，让读者更加深入地了解这个领域。加油！期待你更多精彩的博客内容。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。