Pytorch DataParallel() 多GPU训练

怎样才能回到过去

已于 2023-01-11 13:36:57 修改

阅读量207

点赞数 1

分类专栏： Pytorch 中的各种函数文章标签： pytorch Powered by 金山文档

于 2023-01-11 11:14:15 首次发布

本文链接：https://blog.csdn.net/Z2572862506/article/details/128640498

版权

Pytorch 中的各种函数专栏收录该内容

54 篇文章 1 订阅

订阅专栏

该文介绍了如何在PyTorch中利用DataParallel模块将网络参数分布到多个GPU上进行并行训练。当torch.cuda.device_count()大于1时，创建nn.parallel.DataParallel对象，传入网络模型和设备ID列表，如[0,1,2,3]，然后将DataParallel包装后的模型移动到GPU设备上进行计算。

摘要由CSDN通过智能技术生成

1 目的

将网络中的参数放入到多GPU 中进行训练

2 torch.nn.parallel.DataParallel(module, device_ids, output_device, dim)

参数:

module: 需要进行多 GPU 训练的参数

device_ids: GPU编号( 注意是列表)

另外两个参数都设置成默认就好

3 举例

import toech
import torch.nn as nn

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

class AlexNet(nn.Module):
    ...

if torch.cuda.device_count() > 1:
    alexnet_muti_GPU = nn.parallel.DataPallel(alexnet, device_ids = [0, 1, 2, 3])
alexnet_muti_GPU.to(device)

注意: