日期:2020.10.31
主题:PyTorch入门
内容:
-
根据PyTorch官方教程文档,学习如何使用数据并行(DataParallel)来使用多GPU。
-
根据自己的理解和试验,为代码添加少量注解。
具体代码如下 ↓
"""
{数据并行处理}
"""
"""
【导入和参数】
"""
import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader
# Parameters 和 DataLoaders
input_size = 5
output_size = 2
batch_size = 30
data_size = 100
# 设置device
device = torch.device("cuda: 0" if torch.cuda.is_available() else "cpu")
"""
【虚拟数据集】
"""
# 实现__getitem__来制作一个虚拟(随机)数据集
class RandomDataset(Dataset):
def __init__(self, size, length):
self.len = length
self.data = torch.randn(length, size)
def __getitem__(self, index):
return self.data[index]
def __len__(self):
return self.len
rand_loader = DataLoader(dataset=RandomDataset(input_size, data_size),
batch_size=batch_size, shuffle=True)
"""
【简单模型】
方便起见,这个模型只接受一个输入,执行一个线性操作,然后得到结果。
实际上,我们能在任何模型(CNN,RNN,Capsule Net等)上使用DataParallel。
"""
class Model(nn.Module):
# Our model
def __init__(self, input_size, output_size):
super(Model, self).__init__()
self.fc = nn.Linear(input_size, output_size)
def forward(self, input):
output = self.fc(input)
print("\tIn Model: input size", input.size(),
"output size", output.size())
return output
"""
【创建一个模型和数据并行】
首先,我们需要创建一个模型实例和检测我们是否有多个GPU。
如果我们有多个GPU,我们使用nn.DataParallel来包装我们的模型。
然后通过model.to(device)把模型放到GPU上。
"""
model = Model(input_size, output_size)
if torch.cuda.device_count() > 1:
print("Let's use", torch.cuda.device_count(), "GPUs!")
# dim = 0 [30, xxx] -> [10, ...], [10, ...], [10, ...] on 3 GPUs
model = nn.DataParallel(model)
model.to(device)
"""
【运行模型】
"""
# 观察输入和输出张量的大小
for data in rand_loader:
input = data.to(device)
output = model(input)
print("Outside: input size", input.size(),
"output_size", output.size())
"""
<总结>
DataParallel自动的划分数据,并将作业顺序发送到多个GPU上的多个模型。
DataParallel会在每个模型完成作业后,收集与合并结果然后返回给你。
"""