新手教程之使用LLaMa-Factory微调LLaMa3_llama-factory 如何启动

最新推荐文章于 2024-08-22 08:47:51 发布

月流霜

最新推荐文章于 2024-08-22 08:47:51 发布

阅读量162

点赞数

文章标签： llama AIGC

原文链接：https://blog.csdn.net/David_house/article/details/139426591?spm=1001.2100.3001.7377&utm_medium=distribute.pc_feed_blog_category.none-task-blog-classify_tag-1-139426591-null-null.nonecase&depth_1-utm_source=distribute.pc_feed_blog_category.none-task-blog-c

版权

文章目录

为什么要用LLaMa-Factory
什么是LLaMa-Factory
LLaMa-Factory环境搭建
微调LLaMA3
参考博文

为什么要用LLaMa-Factory

如果你尝试过微调大模型，你就会知道，大模型的环境配置是非常繁琐的，需要安装大量的第三方库和依赖，甚至需要接入一些框架。
但是大模型微调的方法又是非常类似的，那有没有一种工具可以统一这些操作，让大模型微调变成一个简单易上手的事情，LLaMa-Factory就是为了解决这个问题应运而生

什么是LLaMa-Factory

本来不想说这么多废话的，想来想去还是简单介绍一下，也加深自己的了解：
LLaMA Factory是一款支持多种LLM微调方式的工具，包括预训练、指令监督微调和奖励模型训练等。它支持LoRA和QLoRA微调策略，广泛集成了业界前沿的微调方法。特点在于支持多种LLM模型，提供了WebUI页面，使非开发人员也能方便进行微调工作。
代码地址：LLaMA-Factory

LLaMa-Factory环境搭建

克隆项目

git clone https://github.com/hiyouga/LLaMA-Factory.git

  
  
  
  1

创建环境

conda create -n llama_factory python=3.10
conda activate llama_factory

  
  
  
  1
2

安装依赖

cd LLaMA-Factory
pip install -e .[torch,metrics]

  
  
  
  1
2

启动web UI界面

export CUDA_VISIBLE_DEVICES=0
python src/webui.py

  
  
  
  1
2

启动成功之后，游览器会打开如下界面：
在这里插入图片描述

微调LLaMA3

准备模型

方法一：克隆我们要微调的模型到本地，然后将在web UI界面填入我们的模型名称和本地的模型地址

git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B-Instruct.git

  
  
  
  1

方法二：直接去魔塔Meta-Llama-3-8B-Instruct地址复制对应的文件名和路径，微调时，程序会自动去魔搭下载模型！
（这个方法小编浅浅试了一下，没成功，还是下载到本地靠谱）
在这里插入图片描述

准备数据集

LLaMA-Factory项目内置了丰富的数据集，统一存储于data目录下。
如果你想基于自己的数据集微调，你需要
（1）将你的数据集也放到data目录下
注意：你需要将你的数据集改为一样的格式，具体可参考data下内置数据集的格式
这里提供一个小编基于LooksJuicy/ruozhiba数据集改好的一个数据集：

https://pan.baidu.com/s/1FYYlBIXWy697xdagrHiIeg
提取码：2333

（2）修改data下的dataset_info.json文件，添加如下内容：
其中my_data.json是我自己的数据集文件，my_data是对应的数据集文件名

"my_data": {
    "file_name": "my_data.json"
  },

  
  
  
  1
2
3

添加到第一层大括号内的第一个元素前，也就是identity前面

微调

这里我直接通过web ui界面进行微调
在这里插入图片描述

训练需要二十分钟左右，训练完成之后，会出现下述界面：
左下角会显示训练完毕，右边会出现训练过程中损失变化的一个可视化

在这里插入图片描述

与微调之后的模型对话

在这里插入图片描述
这样看来，使用LLaMa-Factory微调确实很简单方便！！！

参考博文

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

普通网友 CSDN认证博客专家 CSDN认证企业博客

码龄14年

261: 原创

-: 周排名

-: 总排名

45万+: 访问

: 等级

1万+: 积分

3456: 粉丝

4630: 获赞

23: 评论

4105: 收藏

私信

关注

热门文章

分类专栏

最新评论

Stable Diffusion文生图模型训练入门实战（完整代码）_stable-diffusion-v1-5
m0_56407676: 非常高质量的博客！想问一下博主，这个数据是怎么处理得到的，能出一个教程吗？
Github/Copilot 学生认证详细步骤_copilot学生认证
Molsndw: 手机没有办法打开啊
超详细Python教程——爬虫框架Scrapy简介
北风之神c: 总结的很全面的爬虫，写得赞，博主用心了。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c8.html ，只需要@boost一行代码，加到任意新/旧爬虫项目就又强又自由又简单。 funboost 分布式函数调度框架，定位于调度用户的任何函数，只要用户在函数里面写爬虫代码，就可以分布式调度爬虫，并且对爬虫函数施加30种控制功能,例如 qps恒定任何时候随意关机重启代码消息万无一失确认消费非常简单的开启多进程叠加线程/协程,这些强大的功能绝大部分爬虫框架还做不到。此框架如果用于爬虫，不管从任何方面比较可以领先scrapy 20年，也比任意写的爬虫框架领先10年。普通爬虫框架一般就设计为url请求调度框架，url怎么请求都是被框内置架束缚死了，所以有些奇葩独特的想法在那种框架里面难以实现，用户需要非常之精通框架本身然后改造框架才能达到随心所欲的驾驭的目的。普通的爬虫框架与用户手写requests 请求解析存储，在流程逻辑上是严重互斥的，要改造成使用那种框架改造需要大改特改。而此框架是函数调度框架，函数里面用户可以随意写一切任意自由想法，天生不会有任何束缚。使用funboost爬虫，与用户使用别的爬虫框架或者无框架用户手写多线程爬虫相比， funboost都代码更少更强更简单更自由。 pip install funboost 或者是直接使用 pip install boost_spider (powerd by funboost ，boost_spider比funboost增加了更加专门的针对爬虫请求和解析和存储） https://github.com/ydf0509/b
github copilot vs 通义灵码 vs 腾讯云 AI 代码助手_腾讯云代码助手与通义灵码哪个好用
希望不转行: 现在呢,这两个哪个好用
Stable Diffusion文生图模型训练入门实战（完整代码）_stable-diffusion-v1-5
m0_56407676: 推理时：在sd-naruto-model文件夹下的结构为：checkpoint-500 checkpoint-1000 checkpoint-1500 ...... 运行推理代码时候一直报错少一些文件什么原因？

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。