迁移学习流程

最新推荐文章于 2024-05-21 16:25:35 发布

baihaisheng

最新推荐文章于 2024-05-21 16:25:35 发布

阅读量167

点赞数

分类专栏： NLP 文章标签：人工智能

本文链接：https://blog.csdn.net/qq_41128383/article/details/107142678

版权

NLP 专栏收录该内容

88 篇文章 4 订阅

订阅专栏

第一步: 下载微调脚本文件



# 克隆huggingface的transfomers文件
git clone https://github.com/huggingface/transformers.git

# 进行transformers文件夹
cd transformers

# 安装python的transformer工具包, 因为微调脚本是py文件.
pip install .

# 进入微调脚本所在路径并查看
cd examples
ls

# 其中run_glue.py就是针对GLUE数据集合任务类型的微调脚本

第二步：配置微调脚本参数

# 定义DATA_DIR: 微调数据所在路径, 这里我们使用glue_data中的数据作为微调数据
export DATA_DIR="../../glue_data"
# 定义SAVE_DIR: 模型的保存路径, 我们将模型保存在当前目录的bert_finetuning_test文件中
export SAVE_DIR="./bert_finetuning_test/"

# 使用python运行微调脚本
# --model_type: 选择需要微调的模型类型, 这里可以选择BERT, XLNET, XLM, roBERTa, distilBERT, ALBERT
# --model_name_or_path: 选择具体的模型或者变体, 这里是在英文语料上微调, 因此选择bert-base-uncased
# --task_name: 它将代表对应的任务类型, 如MRPC代表句子对二分类任务
# --do_train: 使用微调脚本进行训练
# --do_eval: 使用微调脚本进行验证
# --data_dir: 训练集及其验证集所在路径, 将自动寻找该路径下的train.tsv和dev.tsv作为训练集和验证集
# --max_seq_length: 输入句子的最大长度, 超过则截断, 不足则补齐
# --learning_rate: 学习率
# --num_train_epochs: 训练轮数
# --output_dir $SAVE_DIR: 训练后的模型保存路径
# --overwrite_output_dir: 再次训练时将清空之前的保存路径内容重新写入
python run_glue.py \
  --model_type BERT \
  --model_name_or_path bert-base-uncased \
  --task_name MRPC \
  --do_train \
  --do_eval \
  --data_dir $DATA_DIR/MRPC/ \
  --max_seq_length 128 \
  --learning_rate 2e-5 \
  --num_train_epochs 1.0 \
  --output_dir $SAVE_DIR \
  --overwrite_output_dir

第三步: 运行并检验效果

# 使用sh命令运行
sh run_glue.sh

第四步: 设定全局配置并加载微调模型

baihaisheng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
迁移学习流程

第一步: 下载微调脚本文件# 克隆huggingface的transfomers文件git clone https://github.com/huggingface/transformers.git# 进行transformers文件夹cd transformers# 安装python的transformer工具包, 因为微调脚本是py文件.pip install .# 进入微调脚本所在路径并查看cd examplesls# 其中run_glue.py就是针对GLUE数据集合
复制链接

扫一扫

专栏目录