pytorch学习整理（一）

最新推荐文章于 2023-06-22 00:05:33 发布

新手村的一只汪

最新推荐文章于 2023-06-22 00:05:33 发布

阅读量302

点赞数 1

分类专栏： torch 文章标签： pytorch 深度学习 python

本文链接：https://blog.csdn.net/qq_42309888/article/details/121990842

版权

torch 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一、步骤总结

	整体的步骤一共分为4个部分：
	1.准备数据
	2.定义模型
	3.创建模型，调用损失函数和优化器
	4.训练和测试

二、详细说明

   1.准备数据
  在数据准备之前需要引入相关的包：

import torch
from torch import nn
from torchvision import transforms
from torchvision import datasets
from torch.utils.data import DataLoader
import torch.nn.functional as F

利用datasets类和DataLoader类创建训练数据和测试数据：
*（MINST为pytorch官网可提供下载的一种数据集（手写数字数据集），其中为60000张训练数据，10000张测试数据，这里datasets.MNIST()可以直接进行下载到当前目录下）
*参数说明：
root:str 第一个参数为下载数据所存放的路径；
train=True 第二个参数为bool类型，当train=True表示下载训练集，为False则表示下载测试集
download 表示是否下载，一般选择True
transform 表示对数据进行哪些操作，由于下载下来的数据为PIL类型，如果要用pytorch对数据进行操作必须将其转换成张量，也就是tensor类型，所以需要提前处理数据。
(Compose是将多种transform操作集合放在一起，ToTensor()是将图片转化成张量；
Normalize为归一化，让所有图像的像素值满足0~1分布
…
还可以在这里根据需求定义其它处理操作)

batch_size = 64
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.137,),(0.3081,))  #均值,标准差
])

	下载数据并创建DataLoader：

train_dataset = datasets.MNIST('./DataSet/minst/train',train=True,download=True,transform=transform)
test_dataset = datasets.MNIST('./DataSet/minst/test',train=False,download=True,transform=transform)

train_dataloader = DataLoader(train_dataset,shuffle=True,batch_size=batch_size)
test_dataloader = DataLoader(test_dataset,shuffle=False,batch_size=batch_size)

DataLoader是用来加载数据的一个类，可以看成一个迭代器:
第一个参数便是需要迭代的数据，即前面定义的train_dataset 或者 test_dataset;
第二个参数shuffle表示是否将数据顺序打乱；
第三个参数为前面定义的batch_size,表示每次从总的数据样本中取batch_size个数据。

2.定义模型

x = x.view(-1,784) -----表示输入的图像变为1行784列的向量，通俗的说就是将一张28 ✖ 28的图像的所有像素值拼起来，-1表示自动计算N的值（N表示样本数量）
nn.Linear(784,512)-----表示input = 784，output = 512，

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.l1 = nn.Linear(784,512)
        self.l2 = nn.Linear(512,256)
        self.l3 = nn.Linear(256,128)
        self.l4 = nn.Linear(128,64)
        self.l5 = nn.Linear(64,10)
    def forward(self,x):
        x = x.view(-1,784)
        x = F.relu(self.l1(x))
        x = F.relu(self.l2(x))
        x = F.relu(self.l3(x))
        x = F.relu(self.l4(x))
        return self.l5(x)

最后一层不需要relu激活，因为需要输入到softmax中。

3.创建模型，调用损失函数和优化器

#创建模型
mymodel = Net()
#创建损失函数
loss_func = torch.nn.CrossEntropyLoss()
#创建优化器
optimizer = torch.optim.SGD(mymodel.parameters(),lr=0.01,momentum=0.5)

这里选用的损失函数是交叉熵函数CrossEntropyLoss，优化器optimizer 选用的是SGD(随机梯度下降)，关于SGD里面的参数可以参考pytorch官网API：torch.optim

4.对模型进行训练

def train(epoch):
    running_loss = 0.0
    for batch_idex,data in enumerate(train_dataloader,0):
        inputs,targets = data
        optimizer.zero_grad() #清零操作要在优化器优化之前

        outputs = mymodel(inputs)
        loss = loss_func(outputs,targets)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        if batch_idex % 300 ==299:             #epoch+1是因为epoch是从0开始的
            print('[%d,%5d] loss:%.3f' % (epoch + 1,batch_idex+1,running_loss/300))
            running_loss = 0.0

将一轮循环封装成一个train函数，方便使用，也提高了代码的简洁性。

训练步骤可以分为三步：
1.正向传播
2.反向传播
3.更新参数

其中需要注意的几个问题：
1.在每次调用正向传播之后需要optimizer.zero_grad()进行梯度清零操作，不然梯度就会不断累加。
2.running_loss 是用来记录累计的loss值，累加loss直接用loss.item()，不然的话就是计算图，用item取出就是数值。
3.打印操作不需要每次都打印，可以用if来控制打印周期

最后进行测试操作

def test():
    correct = 0
    total = 0
    with torch.no_grad():
        for data in test_dataloader:
            inputs,targets = data
            outputs = mymodel(inputs)
            _,predicted = torch.max(outputs.data,dim=1)
            total += targets.size(0)
            correct += (predicted == targets).sum().item()
    print('Accuracy on test set:%d %% ' % (100 * correct/total))