指令微调与参数微调的代码实践与分析

三月七꧁ ꧂

于 2024-09-09 09:21:39 发布

阅读量247

点赞数 6

分类专栏： LLM 文章标签：深度学习神经网络人工智能 chatgpt prompt 语言模型自然语言处理

本文链接：https://blog.csdn.net/weixin_43961909/article/details/142043520

版权

LLM 专栏收录该内容

29 篇文章 14 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

文章目录

- 指令微调的实验性分析
- LoRA 代码实践与分析

指令微调的示例代码与预训练的代码高度一致，区别主要在于指令微调数据集的构建（SFTDataset）和序列到序列损失的计算（DataCollatorForSupervisedDataset）。以下代码展示了 LLMBox 和 YuLan-Chat 中指令微调的整体训练流程。

1 import torch
2 from dataclasses import dataclass
3 from dataset.sft_dataset import SFTDataset
4 from transformers import (
5 		AutoModelForCausalLM,
6 		AutoTokenizer,
7 		HfArgumentParser,
8 		PreTrainedTokenizer,
9 		TrainingArguments,
10 		Trainer,
11 )
12 from transformers.hf_argparser import HfArg
13
14 IGNORE_INDEX = -100
15
16
17 # 用户输入超参数
18 @dataclass
19 class Arguments(TrainingArguments):
20 	# 模型结构
21 	model_name_or_path: str = HfArg(
22 		default=None,
23 		help="The model name or path, e.g., `meta-llama/Llama-2-7b-hf`",
24 	)
25

了解本专栏

超级会员免费看

三月七꧁ ꧂

关注

6
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
指令微调与参数微调的代码实践与分析

在实验中，我们使用三类指令微调数据集（FLAN v2、ShareGPT 和 Alpaca）和两个拓展的指令集（Alpaca+ 复杂化、Alpaca+ 多样化）来微调 LLaMA-2 模型，通过特定的任务评测来对比不同指令数据集合对于模型性能的影响。为了方便读者了解大模型指令微调的成本，这里使用包含 52K 条指令的 Alpaca 数据集，对不同大小的 LLaMA 模型进行了全参数的指令微调实验。在本节将应用上文的指令微调代码，研究不同类型的指令数据和指令构造策略对于微调大模型的影响。
复制链接

扫一扫