书生·浦语大模型--第四节课笔记--XTuner大模型单卡低成本微调

李日音

已于 2024-01-23 23:35:24 修改

阅读量634

点赞数 13

分类专栏： InternLM大模型文章标签：笔记 chatgpt 机器学习人工智能语言模型

于 2024-01-23 23:33:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lalala12ll/article/details/135738066

版权

InternLM大模型专栏收录该内容

9 篇文章 0 订阅

订阅专栏

在这里插入图片描述

文章目录

Finetune简介
XTuner介绍
- 快速上手
8GB显卡玩转LLM
动手实战环节

Finetune简介

增量预训练和指令跟随
在这里插入图片描述
通过指令微调获得instructed LLM

指令跟随微调

一问一答的方式进行
在这里插入图片描述
对话模板

计算损失

增量预训练微调

不需要问题只需要回答，都是陈述句。计算损失时和指令微调一样
在这里插入图片描述

LoRA QLoRA

不需要太大的显存开销。增加旁路分支Adapter。
在这里插入图片描述
比较：

全参数微调：整个模型加载到显存中，所有模型的参数优化器也要加载到显存中
LoRA微调：模型也需要加载到显存中，但是参数优化器只需要LoRA部分
QLoRA微调：加载模型时就4bit量化加载，参数优化器还可以在CPU和GPU之间调度，显存满了可以在内存里跑

XTuner介绍

在这里插入图片描述

快速上手

在这里插入图片描述

8GB显卡玩转LLM

动手实战环节

关注

13
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
书生·浦语大模型--第四节课笔记--XTuner大模型单卡低成本微调

增量预训练和指令跟随通过指令微调获得instructed LLM。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。