模型构建完成后,以及遍历dataloader时候。我使用了
import torch.nn as nn
import torch.nn.functional as F
class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.conv1 = nn.Conv2d(3, 6, 5)
self.pool = nn.MaxPool2d(2, 2)
self.conv2 = nn.Conv2d(6, 16, 5)
self.fc1 = nn.Linear(16 * 5 * 5, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
def forward(self, x):
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 16 * 5 * 5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
device=torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
在布置gpu时候使用了:net=Net() net=net.to(device)
训练发现loss始终下不去。并且训练速度与在cpu上相比没有加快
后来更改了以下gpu的布置方式:net=Net().to(device) 并且讲dataloader里面的batch_size调大
发现loss能够正常优化了
并且batch_size的大小不同在gpu上的运行速度也有着明显的差距
结论:
pytorch中训练分类器的net.to(device)貌似有坑。建议还是在构建Net()时候直接指定好device
如果在gpu上运行,需要将batch_size调大充分利用gpu的算力