学习笔记pytorch——一个完整的神经网络模型训练套路

准备数据和加载数据

#准备数据
train_data=torchvision.datasets.CIFAR10("./dataset", train=True, transform=torchvision.transforms.ToTensor(), download=True)
test_data=torchvision.datasets.CIFAR10('./dataset', train=False, transform=torchvision.transforms.ToTensor(), download=True)
#Q1:训练数据和测试数据存到一个路径可以吗-->答案是可以

#查看训练集和测试集中图片的数量
train_len=len(train_data)
test_len=len(test_data)
#利用dataloader加载数据
train_loader=DataLoader(train_data, batch_size=64)
test_loader=DataLoader(test_data, batch_size=64)

tips:ctrl+p:可查看所调用的函数的参数


搭建网络框架

import torch
from torch import nn

#搭建网络架构
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.model=nn.Sequential(
            nn.Conv2d(3, 32, 5, stride=1, padding=2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 32, 5, stride=1, padding=2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 5, stride=1, padding=2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(64*4*4, 64),
            nn.Linear(64, 10)
        )
    def forward(self, x):
        x = self.model(x)
        return x

tips:

  • 可将整个网络框架写入一个新的model.py文件中,然后在同一个文件夹目录下,直接使用from model import *调用

  • 可在model.py文件中直接写入main来测试model,#if __name__ == '__main__'理解为: 如果模块是被直接运行的,则代码块被运行,如果模块是被导入的,则代码块不被运行。

#测试网络架构
#if __name__ == '__main__'理解为: 如果模块是被直接运行的,则代码块被运行,如果模块是被导入的,则代码块不被运行。
if __name__ == '__main__':
    tudui=Tudui()
    input=torch.ones((64, 3, 32, 32))
    output=tudui(input)
    print(output.shape)

创建网络模型

tudui=Tudui()

损失函数

loss_fn = nn.CrossEntropyLoss()

调用优化器

optimizer=torch.optim.Adam(tudui.parameter(), lr=0,01)

设置训练网络的参数

#设置训练网络的参数
#记录训练次数
total_train_step=0
#记录测试次数
total_test_step=0
#训练的轮数
epoch=10

开始训练和测试过程

#训练过程
for i in range(epoch):
    print("--------第{}次训练开始--------".format(i))
    for data in train_loader:
        imgs, targets = data
        output=tudui(imgs)
        loss = loss_fn(output, targets)
        #优化器调优
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        total_train_step=total_train_step+1
        if total_train_step % 100==0:
            print("训练次数:{},Loss:{}".format(total_train_step, loss))

    #测试过程
    total_test_loss=0
    with torch.no_grad():
        for data in test_loader:
            imgs, targets= data
            output=tudui(imgs)
            loss=loss_fn(output, targets)
            total_test_loss=total_test_loss+loss
    total_test_step=total_test_step+1
    print("测试次数:{},loss:{}".format(total_test_step, total_test_loss))

训练过程tips:

  • 训练一般不止一轮,训练集中所有的数据跑完一遍是一个epoch
  • format的使用:字符串格式化,format()括号中的内容取代引号中{}的内容
  • 优化器调优时要先将梯度清零,即optimizer.zero_grad(),再进行反向传播

测试过程tips:

  • 在训练集跑完一轮后,进行一次测试,模型是已经训练好的,因此不需要调用grad
  • 计算的损失是在整个测试集上的损失
  • item()的使用:取出单元素张量的元素值并返回该值,保持原元素类型不变。

使用tensorboard绘图

writer=SummaryWriter("./logs_train")
 writer.add_scalar("train_loss", loss, total_train_step)
 writer.add_scalar("test_loss", total_test_loss, total_test_step)
writer.close()

绘图过程

在terminal中输入tensorboard --logdir=logs_train,并回车,即可打开tensorboard窗口

绘图结果


模型的保存

 #模型的保存
    torch.save(tudui, "tudui_{}".format(i))
    print("tudui已保存")

tips:

  • torch.save(tudui,""):保存的是模型的框架和模型的参数

测试正确率

 accuracy=(output.argmax(1)==targets).sum()
 total_accuracy=total_accuracy+accuracy
 writer.add_scalar("准确率", total_accuracy/test_len, total_test_step)

测试结果


补充项

tudui.train()
tudui.eval()

tips:

  • tudui.train在网络具有某些层:例如dropout,batchnorm时需要设置,
  • tudui.eval同理
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值