unbuntu下安装chatglm2-6b记训练篇（一）

镜子里的妖气

已于 2024-09-03 15:02:01 修改

阅读量189

点赞数 6

文章标签：语言模型

于 2024-09-03 14:40:48 首次发布

本文链接：https://blog.csdn.net/wangnannan230521/article/details/141860896

版权

大模型安装好后如何训练是重中之重。本篇我就给大家详细说下在服务器下的如何进行chatglm2-6b的模型训练。

1、首先安装好模型参考我之前发的两篇文章

unbuntu下安装chatglm2-6b记(一)-CSDN博客

2、准备数据集

这里给各位老铁科普下

“大模型数据集”通常指用于训练大规模机器学习模型，特别是深度学习模型（如大型语言模型、计算机视觉模型等）的大量数据集合。随着模型规模的增加，训练这些模型所需的数据量也相应增加，因此需要使用非常庞大的数据集。这里数据集需要就两种常用的格式csv、json.

这里代码里我用的是json格式。

3、编写用于训练的代码

上干货这里我使用lora进行训练

import os
import torch
from transformers import AutoTokenizer, AutoModel, AutoConfig, Trainer, TrainingArguments
from peft import get_peft_model, LoraConfig, TaskType, prepare_model_for_kbit_training, PeftModel
import logging

# 设置日志
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

# 设置环境变量和设备
os.environ['PYTORCH_CUDA_ALLOC_CONF'] = 'max_split_size_mb:128'
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# 设置本地模型路径和卸载文件夹
LOCAL_MODEL_PATH = "/home/sykj/anaconda3/envs/ChatGLM2/ChatGLM2-6B/model"
OFFLOAD_FOLDER = "./offload_folder"

# 确保卸载文件夹存在
os.makedirs(OFFLOAD_FOLDER, exist_ok=True)

# 计算可用 GPU 内存的 60%
if torch.cuda.is_available():
    total_memory = torch.cuda.get_device_properties(0).total_memory
    available_memory = int(total_memory * 0.6)
    available_memory_gb = f"{available_memory / (1024**3):.2f}GB"
    logger.info(f"Setting max memory to {available_memory_gb}")
else:
    available_memory_gb = None
    logger.warning("CUDA is not available

最低0.47元/天解锁文章

镜子里的妖气

关注

6
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
unbuntu下安装chatglm2-6b记训练篇（一）

大模型数据集”通常指用于训练大规模机器学习模型，特别是深度学习模型（如大型语言模型、计算机视觉模型等）的大量数据集合。随着模型规模的增加，训练这些模型所需的数据量也相应增加，因此需要使用非常庞大的数据集。本篇我就给大家详细说下在服务器下的如何进行chatglm2-6b的模型训练。这可以在内存受限的情况下模拟更大的批次大小。设置训练的总轮数为100轮。学习率设置为0.0001,这是一个相对较小的学习率,适合微调。训练参数主要调整训练轮数、学习率、数据集的大小等。训练代码的关键点在于训练参数，内存调整。
复制链接

扫一扫