【ChatGLM2-6B】P-Tuning训练微调

太空眼睛

已于 2023-11-21 18:49:36 修改

阅读量275

点赞数

分类专栏：人工智能文章标签： ChatGLM2 chatglm2-6b 大语言模型 P-Tuning 训练微调 train

于 2023-11-02 16:07:43 首次发布

本文链接：https://blog.csdn.net/friendlytkyj/article/details/134184972

版权

人工智能专栏收录该内容

15 篇文章 2 订阅

订阅专栏

机器配置

阿里云GPU规格ecs.gn6i-c4g1.xlarge
NVIDIA T4显卡*1
GPU显存16G*1

准备训练数据

进入/ChatGLM-6B/ptuning
mkdir AdvertiseGen
cd AdvertiseGen
上传 dev.json 和 train.json
内容都是

{"content": "你是谁", "summary": "你好，我是V校人工智能，江湖人称V-Chat。"}
{"content": "V校", "summary": "全宇宙最牛的智慧校园产品"}

安装依赖

pip install fastapi uvicorn datasets jieba rouge_chinese nltk cpm_kernels

修改train.sh

修改模型参数文件位置: --model_name_or_path ../THUDM/chatglm2-6b
修改后的train.sh

PRE_SEQ_LEN=128
LR=2e-2
NUM_GPUS=1

torchrun --standalone --nnodes=1 --nproc-per-node=$NUM_GPUS main.py \
    --do_train \
    --train_file AdvertiseGen/train.json \
    --validation_file AdvertiseGen/dev.json \
    --preprocessing_num_workers 10 \
    --prompt_column content \
    --response_column summary \
    --overwrite_cache \
    --model_name_or_path ../THUDM/chatglm2-6b \
    --output_dir output/adgen-chatglm2-6b-pt-$PRE_SEQ_LEN-$LR \
    --overwrite_output_dir \
    --max_source_length 64 \
    --max_target_length 128 \
    --per_device_train_batch_size 1 \
    --per_device_eval_batch_size 1 \
    --gradient_accumulation_steps 16 \
    --predict_with_generate \
    --max_steps 3000 \
    --logging_steps 10 \
    --save_steps 1000 \
    --learning_rate $LR \
    --pre_seq_len $PRE_SEQ_LEN \
    --quantization_bit 4

开始训练

bash train.sh

训练进度

查看GPU使用: watch -n 0.5 nvidia-smi

推理

修改evaluate.sh

修改模型参数文件位置: --model_name_or_path ../THUDM/chatglm2-6b
修改后的evaluate.sh

PRE_SEQ_LEN=128
CHECKPOINT=adgen-chatglm2-6b-pt-128-2e-2
STEP=3000
NUM_GPUS=1

torchrun --standalone --nnodes=1 --nproc-per-node=$NUM_GPUS main.py \
    --do_predict \
    --validation_file AdvertiseGen/dev.json \
    --test_file AdvertiseGen/dev.json \
    --overwrite_cache \
    --prompt_column content \
    --response_column summary \
    --model_name_or_path ../THUDM/chatglm2-6b \
    --ptuning_checkpoint ./output/$CHECKPOINT/checkpoint-$STEP \
    --output_dir ./output/$CHECKPOINT \
    --overwrite_output_dir \
    --max_source_length 64 \
    --max_target_length 64 \
    --per_device_eval_batch_size 1 \
    --predict_with_generate \
    --pre_seq_len $PRE_SEQ_LEN \
    --quantization_bit 4

开始推理: sh evaluate.sh

在这里插入图片描述

评测指标为中文 Rouge score 和 BLEU-4。生成的结果保存在 ./output/adgen-chatglm2-6b-pt-128-2e-2/generated_predictions.txt。

运行

修改web_demo.sh

修改模型参数文件位置: --model_name_or_path ../THUDM/chatglm2-6b
修改后的web_demo.sh

PRE_SEQ_LEN=128

CUDA_VISIBLE_DEVICES=0 python3 web_demo.py \
    --model_name_or_path ../THUDM/chatglm2-6b \
    --ptuning_checkpoint output/adgen-chatglm2-6b-pt-128-2e-2/checkpoint-3000 \
    --pre_seq_len $PRE_SEQ_LEN

修改web_demo.sh
在末尾的位置修改如下

#demo.queue().launch(share=False, inbrowser=True)
demo.queue().launch(share=True, inbrowser=True, server_name = '0.0.0.0', server_port=7860)

启动: sh web_demo.sh
浏览器访问: http://xx.xx.xx.xx:7860

Finetune全参数训练

安装依赖: pip install deepspeed
通过DeepSpeed环境报告验证安装并查看计算机与哪些扩展/操作兼容: ds_report

[WARNING]  async_io: please install the libaio-devel package with yum

根据上面这个提示，安装libaio-devel

yum install libaio-devel

安装cudnn

下载地址: https://developer.nvidia.com/rdp/cudnn-download

tar zxvf cudnn-11.2-linux-aarch64sbsa-v8.1.1.33.tgz
sudo cp cuda/include/* /usr/local/cudn/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

查看安装情况: cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

开始训练: bash ds_train_finetune.sh

太空眼睛

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
【ChatGLM2-6B】P-Tuning训练微调

本仓库实现了对于 ChatGLM2-6B 模型基于 P-Tuning v2 的微调。P-Tuning v2 将需要微调的参数量减少到原来的 0.1%，再通过模型量化、Gradient Checkpoint 等方法，最低只需要 7GB 显存即可运行。
复制链接

扫一扫