《Llama3》-XTuner 微调 Llama3 个人小助手认知

最新推荐文章于 2025-05-19 23:14:38 发布

martiliu

最新推荐文章于 2025-05-19 23:14:38 发布

阅读量544

点赞数 12

文章标签：语言模型 python vscode

本文链接：https://blog.csdn.net/martiliu/article/details/138734140

版权

1、自我认知训练数据集准备

站在巨人肩膀上（在标准的Llama3开源大模型上），叠加自我认知数据

[
    {
        "conversation": [
            {
                "system": "你是一个懂中文的小助手",
                "input": "你是（请用中文回答）",
                "output": "您好，我是SmartFlowAI，一个由 SmartFlowAI 打造的人工智能助手，请问有什么可以帮助您的吗？"
            }
        ]
    },
    {
        "conversation": [
            {
                "system": "你是一个懂中文的小助手",
                "input": "你是（请用中文回答）",
                "output": "您好，我是SmartFlowAI，一个由 SmartFlowAI 打造的人工智能助手，请问有什么可以帮助您的吗？"
            }
        ]
    }
]

2、训练模型

# 开始训练,使用 deepspeed 加速，A100 40G显存 耗时24分钟
xtuner train configs/assistant/llama3_8b_instruct_qlora_assistant.py --work-dir /root/llama3_pth

这个阶段首先报了OOM，原因是我的开发机器GPU显存只有10%, 不够。

经过申请，培训方给了GPU显卡(A100)的30%，立刻见效。经过20多分钟的运行，正常。

3、推理验证

虽然这个微调后的大模型，傻的就像是复读机，不过好歹也体验了一遍大模型微调技术。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

martiliu

关注关注

12
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Llama 3 微调项目实践与教程（XTuner 版）

强化学习曾小健

04-20

1502

到此为止我们就让 Llama3 具备了“他是由SmartFlowAI 打造的人工智能助手”的个人认知，本文演示平台为 InternStudio，如其他平台只需适当调整相关路径也能比较顺畅的运行起来，XTuner 玩转 Llama3 图片理解更多玩法请参考：https://github.com/SmartFlowAI/Llama3-XTuner-CN/ （欢迎 Star），同时本周天晚 8 点我们邀请了书生·浦语众多社区大佬一起来分享，欢迎预约直播一起讨论。或者软链接 InternStudio 中的模型。

【Llama 3 五一超级课堂】XTuner 微调 Llama3 个人小助手认知

ouyisee的博客

05-04

605

Llama 3 微调个人小助手认知（XTuner版）

参与评论您还未登录，请先登录后发表或查看评论

【手把手带你微调 Llama3】改变大模型的自我认知，单卡就能训

python122_的博客

05-29

1961

微调Llama3的自我认知后当你问Llama3中文问题：“你叫什么名字？”、“做个自我介绍”、“你好”Llama3 会用中文回答：“我是AI在手”（如下图）

使用 XTuner 完成llama3小助手认知微调

zachary的博客

05-04

501

使用 XTuner 完成llama3小助手认知微调

autodl 上使用 LLaMA-Factory 微调中文版 llama3

Debroon

05-08

4636

模型路径：/root/autodl-tmp/LLM-Research/Meta-Llama-3-8B-Instruct。adapter开头的就是 LoRA 保存的结果了，后续用于模型推理融合。强烈建议选 4090（24G），不然微调的显存不够。我们用 LoRA 微调，至少得 16G（7B模型）。俩个地方都要改：file_name、本地数据集路径。这个数据，ta会去hf官方找，我们可以设置镜像站。微调后，还可以马上测试微调结果。微调后，就找这个路径看一下。方法二：改成本地文件路径。

Llama3-Tutorial之XTuner微调Llama3个人小助手

lldhsds的专栏

05-06

382

Llama3-Tutorial之XTuner微调Llama3个人小助手。使用XTuner微调llama3模型。但是训练后的模型丢失了之前模型的认知。3. XTuner配置文件准备。2. 自我认知训练数据集准备。1. web demo部署。

Llama 3 Web Demo 部署- XTuner 小助手微调- LMDeploy 部署 Llama 3

weixin_46524125的博客

05-05

1037

本博客为基于机智流、Datawhale、ModelScope：Llama3-Tutorial（Llama 3 超级课堂）的作业。

第四课：【XTuner 微调个人小助手认知】笔记

qq_44407313的博客

04-19

1056

q1:为什么要微调？A:目前现有模型都是基座模型，是为了一般性任务进行预训练，运用于实际特定领域效果不佳，需要进行领域内微调q2:两种Finetune范式：A2:增量预训练微调：基座模型学习新知识（文章、书籍、代码）指令跟随微调：模型学会对话模板，根据人类质量进行对话（高质量对话，问答数据）高质量标注原始数据——>改为标准格式数据——>添加对话模板——>Tokenized数据——>添加Label——>开始训练标准数据格式添加对话模板，不同厂家有不同的模板。

【全网首发】Llama 3 微调项目实践与教程（XTuner 版）

qq_39967751的博客

04-23

2221

Llama 3 近期重磅发布，发布了 8B 和 70B 参数量的模型，XTuner 团队对 Llama 3 微调进行了光速支持！！！同时开源社区中涌现了 Llama3-XTuner-CN 手把手教大家使用 XTuner 微调 Llama 3 模型。

【书生浦语】挑战小游戏-S02EP5-XTuner 微调个人小助手认知

weixin_45670481的博客

11-14

395

记录复现过程并截图。

Xtuner微调llava-llama3-

wi162yyxq的博客

08-20

1232

简单介绍llava-llama3-8b模型及微调方式

如何利用 Python 获取京东商品 SKU 信息接口详细说明

J15779585792的博客

05-17

987

通过上述步骤和代码示例，你可以轻松地使用 Python 调用京东商品 SKU 信息接口，获取商品的详细信息。希望这个指南对你有所帮助！如果你对电商数据开发有更多兴趣，可以尝试探索更复杂的功能，如多线程爬取、数据可视化等。如遇任何疑问或有进一步的需求，请随时与我私信或者评论联系。

【python】返回所有匹配项的第一个元素、第二个元素。。。

突围

05-19

237

【python】返回所有匹配项的第一个元素、第二个元素。。

《Python星球日记》第95天：分布式训练与推理

Code_流苏：在代码中寻诗意，在实践中觅真知

05-19

669

《Python星球日记》第95天：分布式训练与推理，今天，我们将探索分布式训练与推理技术，这是解决大规模AI模型训练和部署挑战的关键方法

weibo_comment_pc_tool | 我于2025.5月用python开发的评论采集软件，根据帖子链接爬取评论的界面工具

python布道者0516的博客

05-18

715

开始采集前，先把自己的cookie值填入cookie.txt文件。pc端cookie获取说明：然后把复制的cookie值填写到当前文件夹的cookie.txt文件中。软件首发众公号”老男孩的平凡之路“，欢迎技术交流、深度探讨！

YOLOv7训练时4个类别只出2个类别

qq_48873240的博客

05-16

880

在使用YOLOv7进行训练和预测时，发现模型仅能预测出两个类别（LFM和SFM），而实际应有四个类别。经过检查，特征图大小和anchors设置均与YOLOv3一致，且YOLOv3表现正常。最终发现问题可能出在detect.py中的conf-thres参数设置过高，将其从0.5调整为0.1后，问题得到解决。此外，还需注意在NMS操作时不使用classes参数，并在train.py中根据实际类别数和图片大小调整hyp['cls']和hyp['obj']的缩放比例。这些调整有助于确保模型能够正确预测所有类别。

UserWarning: Do not pass an input_shape/input_dim argument to a layer 问题及其解决

Humbunklung的专栏

05-17

388

xxx\Lib\site-packages\keras\src\layers\core\dense.py:87: UserWarning: Do not pass an input_shape/input_dim argument to a layer. When using Sequential models, prefer using an Input(shape) object as the first layer in the model instead. super().init(activity

Python60日基础学习打卡D30