大模型学习-微调大模型Qwen2

Gratitute_林腾

已于 2024-10-13 23:28:50 修改

阅读量587

点赞数 17

分类专栏：大语言模型文章标签：学习

于 2024-09-14 18:29:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74462339/article/details/142257196

版权

大语言模型专栏收录该内容

5 篇文章 0 订阅

订阅专栏

宇宙免责声明：对B站博主”是花子呀_“的视频教程做的笔记总结

目录

训练前的模型回答

选择微调方法

明确训练目标

制作训练样本

下载资源

https://pan.baidu.com/s/1nHs1WEzbC64GiKbNqiWpJw?pwd=4pje

训练前的模型回答

在pycharm中，运行下面的代码（模型路径改成自己的）

from transformers import pipeline

# 指定模型所在路径
model_path = "E:\\BaiduNetdiskDownload\\just_train\\model\\Qwen2-0.5B-Instruct"

# 加载因果语言模型
pipe = pipeline("text-generation", model=model_path)

# 问题作为输入
question = "8.11和8.9谁更大，8.11还是8.9？"

# 使用该 pipeline 进行生成任务
result = pipe(
    question,
    max_length=100,  # 设置生成的最大长度
    num_return_sequences=1,  # 返回的答案数量
    truncation=True,  # 显式启用截断
    no_repeat_ngram_size=3,  # 防止模型生成重复的句子
    num_beams=5,  # 使用 beam search 来生成更好的答案
    do_sample=True,  # 允许模型生成多个可能的答案
    top_k=50,  # 在每一步中只考虑最有可能的50个词
    temperature=0.7  # 控制生成的多样性，较低的值会让输出更精确，较高的值会增加多样性
)

# 输出结果
print(result[0]['generated_text'])

运行结果

可以看到，回答效果并不好。

选择微调方法

微调模型的方法有很多种，其中一种方法是只会更新模型的部分参数，比如LoRA和QLoRA,这些方法通常在较低的硬件要求下实现模型微调。另一种常见的方法是全参数微调，这种方法会更新模型的所有参数，全参数微调通常对机器的要求较高，需要强大的硬件支持，所以使用云服务器会更方便。

模型选择

确定了微调方法之后，接下来要考虑选择哪个预训练模型，目前全世界的开源模型都会发布在huggingface上，我们可以从这个网站上下载各种各样的模型，这里选择阿里通义千问出品的Qwen2

进入网址:Qwen/Qwen2-72B-Instruct · Hugging Face

明确训练目标

选定了预训练模型之后，需要思考：想把模型调教出什么样子？记住一点：想要模型解决什么样的问题，就需要准备什么样的训练样本

制作训练样本

利用已有的大模型，来帮我们生成训练样本，直接对大模型提需求即可，例如

一个称职的提示语，必须清楚地告诉AI要干什么。

然后将样本复制，保存到文件中即可，

之后我们需要让训练脚本读取这个样本文件来训练模型。

关于训练样本

1.训练样本在train_data.json文件中，提供的资源已经帮我们写好了训练样本，我们不需要改，直接拿来用即可
2.如果要用自己的训练样本，首先文件的名字也要叫train_data.json，因为训练脚本里就是根据这个名字来读取训练样本的，位置也要放在这个目录中

开始训练

接下来开始准备训练模型，可以在本地训练，也可以在云服务器训练。这里推荐使用云服务器训练，因为在本地训练是需要使用wsl2来运行Linux的，关于wsl2，我目前没有了解过，而且个人计算机算力有限，用来训练大模型效率不高。

这里使用的是GPUEZ云服务器，GPUEZ智算云 | 弹性、好用、省钱。租GPU就上ZSCloud

首先，在算力市场里面租一台云服务器

这里可以选择一个比较便宜的

选择镜像后，点击创建

用jupyterLab打开

上传资源

等待进度条跑完，就代表上传完成，这里大概要花20多分钟

进入root目录

cd root

解压上传的资源

unzip just_train.zip

解压完成后，进入just_train文件夹,并开始训练模型

cd just_train
./train.sh

当看到下图的场景时，说明正在进行训练

当进度条到100%时，训练完成

验证模型

训练好的模型会保存到outputs文件夹中

输入./run.sh即可验证输入成果

！！！！操作完之后，记得将实例释放掉，避免继续产生费用

Gratitute_林腾

关注

17
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Gratitute_林腾 CSDN认证博客专家 CSDN认证企业博客

码龄2年

400: 原创

9906: 周排名

6465: 总排名

14万+: 访问

: 等级

5989: 积分

1270: 粉丝

1812: 获赞

14: 评论

1329: 收藏

私信

关注

热门文章

分类专栏

微服务 22篇
操作系统 3篇
Java基础知识 34篇
JavaWeb 43篇
按键精灵 4篇
大语言模型 5篇
办公软件 5篇
爬虫 28篇
Linux 37篇
windows 2篇
vue 57篇
docker 15篇
git 7篇
NLP自然语言处理 1篇
Redis 22篇
前端 4篇
python 21篇
ps 3篇
AE 18篇
unity 56篇
若依框架 16篇
pr 3篇
C4d 8篇
javascript 1篇
Spring Security 4篇
Java设计模式 4篇
neo4j 4篇

最新评论

neo4j-数据的导出和导入
Reese John: Desktop 版本的怎么导出啊
C4d-挤压的一些参数尝试（未完待续）
muyuhwzq: 博主你好纯新手刚入门c4d想问下Mac版的挤压数值为什么和win版的相差很大？拉到6000才和win的800差不多是需要调整哪里吗
爬虫-BeautifulSoup的基本使用
Gratitute_林腾: [code=plain] def img_download(content): print(content) # 解析 soup = BeautifulSoup(content, 'lxml') img_tags = soup.select('div.tupian-list.com-img-txt-list > div > img') src_list = [img['data-original'] for img in img_tags] name_list = [img['alt'] for img in img_tags] print(len(src_list), len(name_list)) for i in range(len(src_list)): name = name_list[i] src = src_list[i] url = 'https:' + src print(url) urllib.request.urlretrieve(url=url, filename='../img/' + name + '.jpg') [/code]
unity-物理材质
ha_lydms: 博文作者真是一位出色的写手！这篇博文让我受益匪浅，语言简洁明了，逻辑严谨有序。作者不仅运用了丰富的例子和引文，为观点提供了充分的支持和验证，还以其独特的视角带给读者全新的思考。
vuex的基本认知
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。