书生浦语第四次作业

梦醒乐

已于 2024-04-24 19:00:33 修改

阅读量500

点赞数 5

文章标签：大作业

于 2024-04-24 18:57:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/invgh/article/details/138138319

版权

本文详细介绍了XTuner的个人小助手部分，包括环境安装、数据生成、模型训练与对话，以及模型对比差异。此外，还涉及了多模态部分的XTuner多模态训练、LLaVA方案和Finetune前后性能对比。

摘要由CSDN通过智能技术生成

一.XTuner个人小助手部分

1.环境安装

首先我们需要先安装一个 XTuner 的源码到本地来方便后续的使用，假如速度太慢可以 Ctrl + C 退出后换成 pip install -e '.[all]' -i https://mirrors.aliyun.com/pypi/simple/。

`2.前期准备`

首先我们先创建一个文件夹来存放所需要的所有文件。之后我们可以在 data 目录下新建一个 generate_data.py 文件，将代码复制进去然后运行该脚本即可生成数据集。然后打开该 python 文件后将下面的内容复制进去并将文件 name 后面的内容修改为你的名称。比如说我是剑锋大佬的话就是：修改完成后运行 generate_data.py 文件即可。

完成之后在data的路径下便生成了一个名为 personal_assistant.json 的文件，里面就包含了 5000 条 input 和 output 的数据对。

之后通过模型准备，配置文件选择，配置文件修改之后，我们就可以真是启动XTuner。

3.模型训练

4.模型对话

5.模型对比差异

假如 prompt-template 选择有误，很有可能导致模型无法正确的进行回复。看到模型已经严重过拟合，回复的话就只有 “我是剑锋大佬的小助手，内在是上海AI实验室书生·浦语的1.8B大模型哦” 这句话。我们下面可以通过对比原模型的能力来看看差异。（第一张图所示）

可以看到在没有进行我们数据的微调前，原模型是能够输出有逻辑的回复，并且也不会认为他是我们特有的小助手。

6.web demo部署

和原来的 InternLM2-Chat-1.8B 模型对话

二.多模态部分

1. XTuner多模态训练与测试

给LLM装上电子眼：多模态LLM原理简介

a.文本单模态

b. 文本+图像多模态

2. 什么型号的电子眼：LLaVA方案简介

a. LLaVA训练阶段示意图

b. LLaVA测试阶段示意图

3. 环境准备

由于前面进行了XTuner安装，可以直接进行下一步

4.概述

5Finetune阶段与 Pretrain阶段

a.Pretrain阶段

在Pretrain阶段，我们会使用大量的图片+简单文本（caption, 即图片标题）数据对，使LLM理解图像中的普遍特征。即，对大量的图片进行粗看。

b.Finetune阶段

在Finetune阶段，我们会使用图片+复杂文本数据对，来对Pretrain得到的Image Projector即iter_2181.pth进行进一步的训练。通过训练数据构建,准备配置文件,就可以开始Finetune

6.对比Finetune前后的性能差异

根据这张图片来进行测试Finetune前后的性能差异

a.Finetune前

b.Finetune后

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

梦醒乐 CSDN认证博客专家 CSDN认证企业博客

码龄1年

13: 原创

138万+: 周排名

15万+: 总排名

4702: 访问

: 等级

198: 积分

47: 粉丝

68: 获赞

6: 评论

40: 收藏

私信

关注

热门文章

最新评论

书生浦语大模型第五次课堂笔记
CSDN-Ada助手: 恭喜作者第六篇博客的发表，看到你一直在坚持不懈地创作，真的很让人佩服！对于“书生浦语大模型第五次课堂笔记”的分享，我觉得你总结得非常到位，让我受益匪浅。希望你在接下来的创作中可以继续保持这样的热情和耐心，不断提升自己的写作水平，也欢迎尝试更多不同主题和风格的文章，多元化的内容会更吸引读者的眼球。加油！期待你的下一篇作品。
书生浦语大模型第五节课作业
CSDN-Ada助手: 恭喜您完成了第7篇博客“书生浦语大模型第五节课作业”，持续创作是非常了不起的事情！在您的博客中，我看到了您对学习的热情和勤奋，这是非常值得肯定的。接下来，我建议您可以尝试多加入一些个人观点和见解，让您的博客更具深度和独特性。期待看到您更多精彩的作品，加油！
书生浦语大模型实战营第三次笔记
CSDN-Ada助手: 恭喜用户发布了第四篇博客！看到您参加书生浦语大模型实战营并积极记录学习笔记，真的很让人欣慰。希望您能继续坚持创作，分享更多关于实战营的学习心得和体会。或许在下一篇博客中，可以结合自己的实践经验，分享一些具体的应用案例或者解决问题的方法，这样更能吸引读者的注意。希望您不断进步，继续保持谦虚的态度，共同成长！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
书生浦语大模型第三次作业
CSDN-Ada助手: 恭喜书生浦语大模型第三次作业的完成！持续创作是非常了不起的，你的努力和执着让人钦佩！接下来，建议可以尝试在作业中加入更多的个人见解和独特观点，让作品更具深度和吸引力。希望你在未来的创作中能够不断进步，展现出更多的潜力和才华！加油！
书生浦语大模型趣味Demo第二节课笔记
CSDN-Ada助手: 非常感谢您分享这篇博客，看到您对书生浦语大模型的研究和实践让人感到非常兴奋！希望您能继续保持热情，持续分享您的学习和实践经验。除了您在博文中提到的内容，您可能还会对模型训练的数据集选择、超参数调整、模型评估等方面进行更深入的探讨，这些都是深度学习领域非常重要的技能和知识点，希望您能够不断拓展自己的学习领域，不断提升自己的技术水平。期待您更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。