书生浦语大模型实战营 - 笔记&作业4 大模型单卡微调

Scorpion_free

已于 2024-01-11 17:54:28 修改

阅读量445

点赞数 8

文章标签：笔记

于 2024-01-11 17:53:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kuangkaiming/article/details/135518864

版权

Finetune 简介

微调的任务

增量预训练（增量续训）

计算全文的loss
让基座模型学到一些领域内新的知识

指令跟随微调

计算回答部分的loss
模型学会对话模板，根据人类指令进行对话

通常有三个角色

System 给定一些上下文信息，比如“你是一个安全的 AI 助手”
User 实际用户，会提出一些问题，比如“世界第一高峰是?“
Assistant 根据的输入，结合 System 的上下文信息，做出回答，比如“珠穆朗玛峰”

对话模板
在这里插入图片描述

微调方式 LoRA & QLoRA

LoRa: 旁路分支，低秩矩阵，Base 模型只参与Forward，只使用Adapter进行Backward更新参数，只保存Adpter中的参数优化器状态（Base Model 不更新参数，不存在优化器状态，降低显存占用）
QLoRA：基本同上，4bit 量化Base Model（进一步降低显存）【可以在GPU和CPU之间Offload，这部分是Xtuner的优化】

XTuner

在这里插入图片描述

对话模式
工具类模型对话
数据处理流程
多数据样本拼接

加速方式、降低显存的方式

FlashAttention
DeepSpeed ZeRo

作业

在这里插入图片描述

关注

8
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
书生浦语大模型实战营 - 笔记&作业4 大模型单卡微调

计算全文的loss让基座模型学到一些领域内新的知识。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。