【InternLM 实战营第二期】第四节笔记

最新推荐文章于 2024-07-14 11:42:14 发布

2301_77831574

最新推荐文章于 2024-07-14 11:42:14 发布

阅读量534

点赞数 23

文章标签：笔记飞书

本文链接：https://blog.csdn.net/2301_77831574/article/details/137974049

版权

参考：

视频教学：https://b23.tv/QUhT6ni
文档链接：https://github.com/InternLM/Tutorial/blob/camp2/xtuner/personal_assistant_document.md

在这里插入图片描述
例子

LoRA & QLoRA
在这里插入图片描述

XTuner快速上手：在这里插入图片描述

FlashAttention和DeepSpeedZeRO是XTuner最重要的两个优化技巧。
在这里插入图片描述

InternLM2-1.8B提供了三个版本的开源模型，大家可以按需选择。

InternLM2-1.8B：具有高质量和高适应灵活性的基础模型，为下游深度适应提供了良好的起点。
InternLM2-Chat-1.8B-SFT:在InternLM2-1.8B上进行监督微调周（SFT）后得到的对话模型。
InternLM2-Chat-1.8B:通过在线RLHF在InternLM2-Chat-1.8B-SFT之上进一步对齐。InternLM2-Chat-1.8B表现出更好的指令跟随、聊天体验和函数调用推荐下游应用程序使用。（模型大小仅为3.78GB）

在FP16精度模式下，InternLM2-1.8B仅需4GB显存的笔记本显卡即可顺畅运行。拥有8GB显存的消费级显卡，即可轻松进行1.8B模型的微调工作。如此低的硬件门槛非常适合初学者使用，以深入了解和掌握大模型的全链路。

Haotian Liu等使用GPT-4V对图像数据生成描述，以此构建出大量< question text > < image > – < answertext >的数据对。
利用这些数据对，配合文本单模态LLM，训练出一个Image Projector。
所使用的文本单模型LLM和训练出来的ImageProjector，统称为LLaVA模型。

在这里插入图片描述

关注