LLMs之LLaMA-2：基于云端进行一键部署对LLaMA2模型实现推理(基于text-generation-webui)执行对话聊天问答任务、采用LoRA微调LLaMA-2-7B模型(配置云端环境【

一个处女座的程序猿

已于 2024-04-08 15:04:01 修改

阅读量2.2k

点赞数 4

分类专栏： NLP/LLMs AI/AGI 精选(人工智能)-中级文章标签：自然语言处理基础大模型 LLaMA

于 2023-07-30 22:33:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41185868/article/details/132012781

版权

精选(人工智能)-中级同时被 3 个专栏收录

320 篇文章 1316 订阅 ¥99.90 ¥299.90

订阅专栏

557 篇文章 426 订阅

订阅专栏

322 篇文章 225 订阅

订阅专栏

本教程详细介绍了如何在Google Colab上通过text-generation-webui一键部署LLaMA2模型进行对话问答任务，并使用LoRA微调LLaMA-2-7B模型。内容包括配置云端GPU环境、下载novel17_test数据集、利用transformers库加载模型、使用peft和wandb进行模型微调，以及通过HuggingFace实现训练成果的云端分享。

摘要由CSDN通过智能技术生成

LLMs之LLaMA-2：基于云端进行一键部署对LLaMA2模型实现推理(基于text-generation-webui)执行对话聊天问答任务、采用LoRA微调LLaMA-2-7B模型(配置云端环境【A100】→下载数据集(采用novel17_test对话数据集(Human-Assistant格式))→加载模型【transformers】→分词→模型训练【peft+SFTTrainer+wandb】→基于HuggingFace实现云端分享)之图文教程详细攻略

目录

一、基于云端(在Google Colab上)进行一键部署并推理

第一步，进入text-generation-webui的GitHub官网页面

第二步，选择对应并合适的模型版本

(1)、云端运行代码

(2)、指定模型—已经自带模型

第三步，基于指定模型实现模型推理—对话聊天、提问问题

二、基于云端(在Google Colab上)实现微调LLaMA2模型

第一步，配置云端环境

1.1、配置A100的GPU

1.2、安装依赖

第二步，采用novel17_test对话数据集(Human-Assistant格式)：基于datasets库下载

AlexanderDoria/novel17_test数据集的详细内容及其格式

第三步，模型微调(采用lora微调LLaMA-2-7B)：基于transformers库、peft 库

3.1、加载LLaMA-2-7B模型

3.3、加载参数微调库

3.4、模型微调

(1)、载入训练器

(2)、设置参数

(3)、开始微调训练：基于wandb跟踪可视化训练

第四步，将训练过程信息上传到HuggingFace账户实现云端分享

4.1、登录HuggingFace账户

4.2、粘贴tokens后，再点击login，

4.3、运行push_to_hub代码即可实现云端分享

了解本专栏

一个处女座的程序猿

关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

一个处女座的程序猿 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。