Finetune时利用自己的训练数据或者测试数据

最新推荐文章于 2024-07-29 19:00:00 发布

Alicesla

最新推荐文章于 2024-07-29 19:00:00 发布

阅读量667

点赞数

文章标签： python 自然语言处理深度学习 pytorch

本文链接：https://blog.csdn.net/alicesla/article/details/119760791

版权

以huggingface- transformer中实现的的text-classification为例。

在使用bash运行时，删掉task_name 或是其他可以自动下载数据集的传入参数。

按需增加以下传入参数

（训练/测试/验证集要是.csv或者.json文件）

--train_file 训练集地址 \
--validation_file 验证集地址 \
--test_file 测试集地址 \
--do_train \
--do_eval \
--do_predict \

以下是我的bash：

python3 run_glue.py \
  --model_name_or_path bert-base-uncased \
  --train_file ./data/train.csv \
  --validation_file ./data/dev.csv \
  --test_file ./data/test.csv \
  --do_train \
  --do_eval \
  --do_predict \
  --max_seq_length 128 \
  --per_device_train_batch_size 8 \
  --learning_rate 2e-5 \
  --num_train_epochs 3 \
  --output_dir /tmp/run_glue/

之后在加载数据的时候就会加载自己的数据了

加载本地数据代码段（transformers代码）


# Loading a dataset from your local files.
# CSV/J

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Alicesla

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

利用caffe-ssd对钢材表面缺陷数据集(NEUDataset)进行finetune训练和测试

jsk_learner的博客

07-11

6501

本篇博客主要讲解如何使用在VOC0712数据集下训练好的ssd.caffemodel来对自己的数据集进行finetune训练，涉及到NEUDataset、一些python脚本代码、网络结构的修改、网络训练和测试流程以及批量生成测试图片的python代码。同时，本篇博客不会再涉及到路径和名称修改问题，关于caffe-ssd的安装编译、网络训练和测试以及路径和名称修改等问题请参考我这篇博客：目标检测SSD网络在Caffe下的实现

基于transformers+bert预训练模型在语义相似度任务上的finetune

03-22

基于transformers+bert预训练模型在语义相似度任务上的finetune

参与评论您还未登录，请先登录后发表或查看评论

finetune训练模型

tonydandelion2014的博客

03-31

1826

在已有模型上finetune自己的数据训练一个模型 1、准备训练数据和测试数据 2、制作标签 3、数据转换,将图片转为LMDB格式前三步的过程和如何利用自己的数据训练一个分类网络是一样的，参考处理即可。 4、修改网络模型文件复制/caffe-root/models/finetune_flickr_style文件夹下面的deploy.prototxt ...

glm4-9b的lora.yaml文件说明

最新发布

goubi4056的博客

07-29

1389

如果设置 max_steps: 3000，即使有多个epoch，每个epoch包含1000步，训练也将在达到第3000步时停止，而不再继续。：如果训练过程设定了 max_steps 为 3000，那么在训练过程中，将分别在第500步、第1000步、第1500步、第2000步、第2500步和第3000步保存检查点。这在对话生成任务中尤其常见。：如果有两个GPU，且 per_device_eval_batch_size 设置为 4，那么每次评估时每个GPU处理4个样本，总共处理8个样本。

tensorflow中slim下的分类网络训练自己的数据集以及fine-tune

bemy1008的博客

05-26

603

转载自： https://blog.csdn.net/stesha_chen/article/details/81976415 谢谢大佬，这是我见过最适合入门者的文档。目录前期准备训练flower数据集(包括fine-tuning) 训练自己的数据集(包括fine-tuning) 前

深度学习中，training, validation 和 test set 的区别

weixin_45823587的博客

05-09

1405

1. 综述可能是因为缺少实践经验，好几次都记不清 training set，validation set 和 test set 的区别，尤其是 validation set 很容易和 test set 弄混。每次都是忘了再查，查了又忘。这次干脆记录下来方便以后复习，也供大家一起学习。 2. training set training set 汉语是训练集，也就是训练神经网络时需要使用的集合。他的主要作用是在 back propagation 的时候调整网络中的权重，以减小损失函数。 3.valid

【ChatGLM】使用ChatGLM-6B-INT4模型进行P-Tunning训练记录及参数讲解

浩瀚宇宙的一粒尘埃

06-09

8021

pre_seq_len的取值范围一般是1到512，它表示自然语言指令的长度，即输入序列中的前pre_seq_len个token，具体的值需要根据自然语言指令的长度和复杂度来确定。一种可能的方法是，根据不同的指令类型设置不同的pre_seq_len值，例如，对于简单的指令，如“生成一个笑话”，可以设置pre_seq_len为4；不完全是的，pre_seq_len和max_source_length的含义是不同的，但是它们之间有一定的关系。因此，需要根据具体的任务和数据集来调整这个参数，以达到最佳的效果。

ChatGLM-6B的P-Tuning微调详细步骤及结果验证

热门推荐

scorpio的博客

04-26

1万+

ChatGLM-6B的P-Tuning微调详细步骤及结果验证

finetune-images

11-03

2. **数据准备**：准备自己的特定任务数据集，如本案例中的"finetune-images"，确保数据集被正确地标注和划分，通常分为训练集、验证集和测试集。 3. **模型适应**：保留预训练模型的卷积层（因为它们包含了通用...

finetune_alexnet_with_tensorflow-master

05-05

AlexNet的成功在于其大规模的数据集训练、ReLU激活函数的引入以及GPU并行计算的利用，这使得它在图像识别任务上取得了显著优于传统方法的性能。二、TensorFlow概述 TensorFlow是一个用于数值计算的开源库，尤其...

Validate File Format

three_man的专栏

08-08

765

通过Schema来校验File格式的正确与否

transformer bert微调实例---细节解读

王小二的博客

12-22

2614

源码来源：https://github.com/huggingface/transformers/tree/master/examples/pytorch/text-classification 代码解读 #!/usr/bin/env python # coding=utf-8 """ Finetuning the library models for sequence classification on GLUE.""" # You can also adapt this script on your

TensorFlow训练分类模型及Finetune实操

bemy1008的博客

05-27

2859

转自：https://blog.csdn.net/czp_374/article/details/81133641 写的太好了！！！这篇文章关注的重点是如何使用

DeepFill v2踩坑记录

David9591的博客

10-26

1230

在跑著名的deepfill_2时，遇到了一点麻烦，在此记录一下，如果能帮到遇到相同问题的朋友就再好不过了(*^▽^*) 论文：Free-Form Image Inpainting with Gated Convolution（https://arxiv.org/abs/1806.03589）项目地址：https://github.com/JiahuiYu/generative_inpainting 言归正传： 1.Prepare training images filelist 作者给出了例子，

chatglm——从部署到训练全流程&&你遇到的错误都在这里。

04-17

8089

chatglm成功部署在阿里云PAI平台

大模型训练基本流程讨论

chaishen10000的专栏

06-20

7332

让pre-model自动化的生成模版，思路如下，fix主pre-train模型，让模型对有标注的任务做训练，模型学习后改的输入的句子embbeding，当然输入原句是不改的，只是让模型改非输入句子部分，最后就可以自动化的学习到最有prompt模版了。通常情况下，预训练模型的大小越大，它在各种任务上的表现也越好，但同时需要消耗更多的计算资源[1]。这张图表示的意思是，我还是我，但是我经过简单变化和学习后，我就可以成为多样不一样的我，但是pre-train模型是不动的，动的只是参入的参数，眼睛、一幅、装饰。

使用LoRA对大语言模型LLaMA做Fine-tune

蒋含竹的博客

05-29

9128

目前有大量对LLM（大语言模型）做Fine-tune的方式，不过需要消耗的资源非常高，例如Stanford Alpaca: 对LLaMA-7B做Fine-tune，需要4颗A100 (80GB) GPUFastChat/Vicuna: 对LLaMA-7B做Fine-tune，需要4颗A100 (40GB) GPU这种资源需求令普通的学习者望而却步，使用LoRA则可以较好的解决这个问题LoRA全称为。

windows下实现对chatGLM-6B的微调

Asunazhang的博客

04-13

3955

windows环境下实现对chatGLM-6B的微调

小数据集在finetune后效果不好，还能怎样优化

06-09

3. 迁移学习：使用与任务相似的领域的数据集进行训练，再将模型迁移到目标任务上进行fine-tune，可以提高模型的泛化能力。 4. 调整模型结构：可以尝试增加模型的层数、调整模型的超参数等。 5. 集成学习：使用多个...