一、训练网络
1.1 代码
for epoch in range(2):
running_loss = 0.0
for i,data in enumerate(trainloader,0):
inputs,labels = data
optimizer.zero_grad()
outputs = net(inputs)
loss = criterion(outputs,labels)
loss.backward()
optimizer.step()
running_loss += loss.item()
if i % 2000 == 1999:
print('[%d,%5d] loss:%.3f' % (epoch + 1,i+1,running_loss/2000))
running_loss = 0.0
print("Finish")
注:python中的enumerater是指接收一个可迭代对象为参数(还可以用
start
参数用于表明起始下标,即下面的0
),返回一个元组,元组第一位为迭代数(从0
开始),第二位即为可迭代对象的一项。
1.2 训练网络的目的
通过一个循环,按照batch从训练数据集中取出数据,将数据喂给网络,得到网络的预测结果后,使用 loss_function
计算损失,然后再将损失反向传播得到所有参数的梯度,最后使用 optimizer
更新参数即可。
网络根据输入的数据进行更新,给图片标签让网络计算损失函数,然后更新网络参数,生成模型。
1.3 保存训练参数
PATH='./cifar_net.pth'
torch.save(net.state_dict(),PATH)
1.4 查看正确输出
dataiter = iter(testloader)
images,labels = dataiter.next()
imshow(torchvision.utils.make_grid(images))
print('GroundTruth:',' '.join('%5s'% classes[labels[j]] for j in range(4)))
二、测试网络
2.1 查看预测效果
# 实例化网络
net = Net()
PATH='./cifar_net.pth'
net.load_state_dict(torch.load(PATH))
outputs = net(images)
_,predicted = torch.max(outputs,1)
print('Predicted:',' '.join('%5s'% classes[predicted[j]] for j in range(5)))
2.2 准确率
与训练网络不同的是,测试网络不需要计算梯度,测试网络的代码通常在torch.no_grad()下完成。
准确率可以观察整个训练集的预测结果表现:
correct = 0
total = 0 # 整个数据集的大小
with torch.no_grad():
for data in testloader:
images,labels = data
outputs = net(images)
_,predicted = torch.max(outputs,1)
total += labels.size(0)
# 两个维度的向量逐行对比,相同的即正确的行记为1,不同的即不准确的行记为0,利用sum()求各元素的总和
correct += (predicted == labels).sum().item()
correctGailv = 100*(correct / total)
print(correctGailv)
注意:对输出向量做max操作得到取得最大值的类。
(因为训练次数太少,所以准确率较低。)