transformers 实现多卡推理

import os

import platform

import signal

from transformers import AutoTokenizer, AutoModel,AutoModelForCausalLM

import readline

import torch.nn as nn

# os.environ["CUDA_VISIBLE_DEVICES"] = '1'

max_memory_mapping = {0 : "10GB", 1 :"11GB"}

tokenizer = AutoTokenizer.from_pretrained('your_model_path', trust_remote_code=True)

model = AutoModel.from_pretrained("your_model_path",

                                             device_map= 'auto',

                                             load_in_8bit = False,

                                             max_memory = max_memory_mapping,

                                              trust_remote_code=True).half().cuda()

model = model.eval()

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
Transformers多卡训练可以通过使用PyTorch的DataParallel或DistributedDataParallel模块来实现。其中,DataParallel是在单机多卡之间并行化模型训练,而DistributedDataParallel则是在多台机器之间并行化模型训练。 下面是一个使用DataParallel模块进行多卡训练的示例代码: ``` import torch from torch.nn.parallel import DataParallel from transformers import BertForSequenceClassification, BertTokenizer # 加载模型和tokenizer model = BertForSequenceClassification.from_pretrained('bert-base-uncased') tokenizer = BertTokenizer.from_pretrained('bert-base-uncased') # 数据并行化 device_ids = [0, 1, 2, 3] model = DataParallel(model, device_ids=device_ids) # 将模型移到GPU上 device = torch.device('cuda:0') model.to(device) # 训练循环 for epoch in range(num_epochs): for batch in dataloader: # 将数据移到GPU上 inputs = {k: v.to(device) for k, v in batch.items()} # 前向传播 outputs = model(**inputs) # 计算损失 loss = outputs.loss # 反向传播 loss.backward() # 更新参数 optimizer.step() optimizer.zero_grad() ``` 在以上代码中,我们首先加载了模型和tokenizer,然后使用DataParallel模块将模型并行化。接着,我们将模型移动到GPU上,并在训练循环中将数据也移到GPU上。最后,我们进行正常的前向传播、计算损失、反向传播和更新参数的操作。 需要注意的是,在进行多卡训练时,batch size需要根据卡数进行调整,以充分利用多卡的计算资源。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值