clone&run_lora

要使用 LoRA(Low-Rank Adaptation)进行模型微调,首先需要设置环境并了解训练流程。以下是一个从 clone 代码库到训练 LoRA 的基本步骤:

1. Clone LoRA 项目代码

首先,需要从 LoRA 的相关项目仓库(例如 Hugging Face 或其他模型微调库)中 clone 代码。你可以在 GitHub 上找到与 LoRA 相关的项目。例如,如果你要微调 Hugging Face 上的模型:

git clone https://github.com/huggingface/transformers
cd transformers
pip install -e .

2. 安装依赖

安装用于训练 LoRA 所需的依赖项。通常依赖库包括 transformers, datasets, 和 accelerate

pip install transformers datasets accelerate

此外,如果你需要使用 bitsandbytes 来减少 GPU 显存占用:

pip install bitsandbytes

3. 准备数据集

获取合适的数据集进行微调。你可以从 Hugging Face 的 datasets 库中加载数据:

from datasets import load_dataset

# 例如加载SQuAD数据集
dataset = load_dataset("squad")

4. 准备模型和 LoRA 配置

你可以从 Hugging Face 的预训练模型中加载你想要微调的模型,并设置 LoRA 配置。peft(Parameter Efficient Fine-Tuning)库可以帮助你在 Hugging Face 模型中集成 LoRA:

from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
from peft import LoraConfig, get_peft_model

# 加载模型和分词器
model_name = "t5-small"  # 替换为你想微调的模型
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# 设置 LoRA 配置
lora_config = LoraConfig(
    r=16,           # 隐藏层中低秩矩阵的秩
    lora_alpha=32,  # LoRA 的比例因子
    lora_dropout=0.05,
    target_modules=["q", "v"],  # 选择你要应用 LoRA 的模块
)

# 获取 LoRA 模型
model = get_peft_model(model, lora_config)

5. 开始训练

你可以使用 Hugging Face 提供的 Trainer 来训练带有 LoRA 的模型。以下是一个简单的例子:

from transformers import Seq2SeqTrainingArguments, Seq2SeqTrainer

# 设置训练参数
training_args = Seq2SeqTrainingArguments(
    output_dir="./results",
    evaluation_strategy="epoch",
    per_device_train_batch_size=16,
    per_device_eval_batch_size=16,
    predict_with_generate=True,
    num_train_epochs=3,
)

# 设置 Trainer
trainer = Seq2SeqTrainer(
    model=model,
    args=training_args,
    train_dataset=dataset["train"],
    eval_dataset=dataset["validation"],
    tokenizer=tokenizer,
)

# 开始训练
trainer.train()

6. 保存和加载微调模型

训练完成后,你可以保存微调好的模型:

model.save_pretrained("./lora_model")
tokenizer.save_pretrained("./lora_model")

要加载训练好的模型进行推理:

from transformers import AutoModelForSeq2SeqLM, AutoTokenizer

model = AutoModelForSeq2SeqLM.from_pretrained("./lora_model")
tokenizer = AutoTokenizer.from_pretrained("./lora_model")

总结

  1. Clone 代码库: 你可以从 GitHub 上 clone LoRA 项目代码,或是使用 Hugging Face 的相关工具。
  2. 安装依赖: 安装 LoRA 相关的库(transformersdatasetspeft)。
  3. 数据准备: 使用 Hugging Face 的 datasets 加载训练数据。
  4. 模型和配置: 使用 peft 配置 LoRA,并加载要微调的模型。
  5. 训练模型: 使用 Hugging Face 的 Trainer 进行训练。
  6. 保存模型: 保存训练好的 LoRA 模型用于推理。

这样,你就可以使用 LoRA 来进行参数高效的模型微调了。

#ifndef CONFIG_HAVE_COPY_THREAD_TLS /* For compatibility with architectures that call do_fork directly rather than * using the syscall entry points below. */ long do_fork(unsigned long clone_flags, unsigned long stack_start, unsigned long stack_size, int __user *parent_tidptr, int __user *child_tidptr) { struct kernel_clone_args args = { .flags = (clone_flags & ~CSIGNAL), .pidfd = parent_tidptr, .child_tid = child_tidptr, .parent_tid = parent_tidptr, .exit_signal = (clone_flags & CSIGNAL), .stack = stack_start, .stack_size = stack_size, }; if (!legacy_clone_args_valid(&args)) //1.查找 pid 位图,为子进程分配新的 pid return -EINVAL; return _do_fork(&args); } long _do_fork(struct kernel_clone_args *args) { u64 clone_flags = args->flags; struct completion vfork; struct pid *pid; struct task_struct *p; int trace = 0; long nr; //2.关于进程追踪的设置 if (!(clone_flags & CLONE_UNTRACED)) { if (clone_flags & CLONE_VFORK) trace = PTRACE_EVENT_VFORK; else if (args->exit_signal != SIGCHLD) trace = PTRACE_EVENT_CLONE; else trace = PTRACE_EVENT_FORK; if (likely(!ptrace_event_enabled(current, trace))) trace = 0; } //3.复制进程描述符 p = copy_process(NULL, trace, NUMA_NO_NODE, args); add_latent_entropy(); if (IS_ERR(p)) return PTR_ERR(p); trace_sched_process_fork(current, p); pid = get_task_pid(p, PIDTYPE_PID); nr = pid_vnr(pid); if (clone_flags & CLONE_PARENT_SETTID) put_user(nr, args->parent_tid); if (clone_flags & CLONE_VFORK) { p->vfork_done = &vfork; init_completion(&vfork); get_task_struct(p); } //4.将子进程放在运行队列中父进程的前面 wake_up_new_task(p); /* forking complete and child started to run, tell ptracer */ if (unlikely(trace)) ptrace_event_pid(trace, pid); if (clone_flags & CLONE_VFORK) { //5.如果是 vfork() 的话父进程插入等待队列,挂起父进程直到子进程释放自己的内存地址空间 //(直到子进程结束或者执行新的程序) if (!wait_for_vfork_done(p, &vfork)) ptrace_event_pid(PTRACE_EVENT_VFORK_DONE, pid); } put_pid(pid); return nr; }加上注释
06-11
#ifndef CONFIG_HAVE_COPY_THREAD_TLS /* For compatibility with architectures that call do_fork directly rather than * using the syscall entry points below. */ // 如果架构直接调用 do_fork 而不是使用下面的系统调用入口点,则需要兼容性。 long do_fork(unsigned long clone_flags, unsigned long stack_start, unsigned long stack_size, int __user *parent_tidptr, int __user *child_tidptr) { // do_fork 函数是创建一个新进程的主函数,传递给它一些参数,如标志、子进程栈的起始位置和大小、父子进程的 TID 等。 struct kernel_clone_args args = { .flags = (clone_flags & ~CSIGNAL), // 去除信号标志以获取其他标志 .pidfd = parent_tidptr, // 将新进程的 TID 存储在父进程的地址空间中 .child_tid = child_tidptr, // 将新进程的 TID 存储在子进程的地址空间中 .parent_tid = parent_tidptr, // 将父进程的 TID 存储在新进程的地址空间中 .exit_signal = (clone_flags & CSIGNAL), // 退出信号标志 .stack = stack_start, // 子进程栈的起始位置 .stack_size = stack_size, // 子进程栈的大小 }; if (!legacy_clone_args_valid(&args)) // 检查传递给 do_fork 的参数是否有效 return -EINVAL; return _do_fork(&args); // 调用 _do_fork 函数创建新进程 } long _do_fork(struct kernel_clone_args *args) { // _do_fork 函数是创建新进程的内部函数,它接受一个 kernel_clone_args 结构体作为参数,该结构体包含了创建进程所需的各种参数。 u64 clone_flags = args->flags; // 获取标志 struct completion vfork; // 用于 vfork 的完成量 struct pid *pid; // 进程 ID struct task_struct *p; // 新的进程描述符 int trace = 0; // 进程追踪标志 long nr; // 进程 ID // 关于进程追踪的设置 if (!(clone_flags & CLONE_UNTRACED)) { // 如果没有设置 CLONE_UNTRACED 标志,则可以追踪进程 if (clone_flags & CLONE_VFORK) trace = PTRACE_EVENT_VFORK; else if (args->exit_signal != SIGCHLD) trace = PTRACE_EVENT_CLONE; else trace = PTRACE_EVENT_FORK; if (likely(!ptrace_event_enabled(current, trace))) trace = 0; } // 复制进程描述符 p = copy_process(NULL, trace, NUMA_NO_NODE, args); add_latent_entropy(); if (IS_ERR(p)) return PTR_ERR(p); trace_sched_process_fork(current, p); pid = get_task_pid(p, PIDTYPE_PID); nr = pid_vnr(pid); if (clone_flags & CLONE_PARENT_SETTID) put_user(nr, args->parent_tid); if (clone_flags & CLONE_VFORK) { p->vfork_done = &vfork; init_completion(&vfork); get_task_struct(p); } // 将子进程放在运行队列中父进程的前面 wake_up_new_task(p); /* forking complete and child started to run, tell ptracer */ if (unlikely(trace)) ptrace_event_pid(trace, pid); if (clone_flags & CLONE_VFORK) { // 如果是 vfork() 的话,父进程插入等待队列,挂起父进程直到子进程释放自己的内存地址空间 //(直到子进程结束或者执行新的程序) if (!wait_for_vfork_done(p, &vfork)) ptrace_event_pid(PTRACE_EVENT_VFORK_DONE, pid); } put_pid(pid); return nr; } // 该代码段实现了创建新进程的功能,主要包括以下几个步骤: // 1. 查找 pid 位图,为子进程分配新的 pid。 // 2. 关于进程追踪的设置。 // 3. 复制进程描述符。 // 4. 将子进程放在运行队列中父进程的前面。 // 5. 如果是 vfork() 的话,父进程插入等待队列,挂起父进程直到子进程释放自己的内存地址空间(直到子进程结束或者执行新的程序)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值