pytorch学习整理(一)

一、步骤总结

	整体的步骤一共分为4个部分:
	1.准备数据
	2.定义模型
	3.创建模型,调用损失函数和优化器
	4.训练和测试

二、详细说明

   1.准备数据
  在数据准备之前需要引入相关的包:
import torch
from torch import nn
from torchvision import transforms
from torchvision import datasets
from torch.utils.data import DataLoader
import torch.nn.functional as F

利用datasets类和DataLoader类创建训练数据和测试数据:
*(MINST为pytorch官网可提供下载的一种数据集(手写数字数据集),其中为60000张训练数据,10000张测试数据,这里datasets.MNIST()可以直接进行下载到当前目录下)
*参数说明:
root:str 第一个参数为下载数据所存放的路径;
train=True 第二个参数为bool类型,当train=True表示下载训练集,为False则表示下载测试集
download 表示是否下载,一般选择True
transform 表示对数据进行哪些操作,由于下载下来的数据为PIL类型,如果要用pytorch对数据进行操作必须将其转换成张量,也就是tensor类型,所以需要提前处理数据。
(Compose是将多种transform操作集合放在一起,ToTensor()是将图片转化成张量;
Normalize为归一化,让所有图像的像素值满足0~1分布

还可以在这里根据需求定义其它处理操作)

batch_size = 64
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.137,),(0.3081,))  #均值,标准差
])
	下载数据并创建DataLoader:
train_dataset = datasets.MNIST('./DataSet/minst/train',train=True,download=True,transform=transform)
test_dataset = datasets.MNIST('./DataSet/minst/test',train=False,download=True,transform=transform)

train_dataloader = DataLoader(train_dataset,shuffle=True,batch_size=batch_size)
test_dataloader = DataLoader(test_dataset,shuffle=False,batch_size=batch_size)

DataLoader是用来加载数据的一个类,可以看成一个迭代器:
第一个参数便是需要迭代的数据,即前面定义的train_dataset 或者 test_dataset;
第二个参数shuffle表示是否将数据顺序打乱;
第三个参数为前面定义的batch_size,表示每次从总的数据样本中取batch_size个数据。

2.定义模型

x = x.view(-1,784) -----表示输入的图像变为1行784列的向量,通俗的说就是将一张28 ✖ 28的图像的所有像素值拼起来,-1表示自动计算N的值(N表示样本数量)
nn.Linear(784,512)-----表示input = 784,output = 512,

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.l1 = nn.Linear(784,512)
        self.l2 = nn.Linear(512,256)
        self.l3 = nn.Linear(256,128)
        self.l4 = nn.Linear(128,64)
        self.l5 = nn.Linear(64,10)
    def forward(self,x):
        x = x.view(-1,784)
        x = F.relu(self.l1(x))
        x = F.relu(self.l2(x))
        x = F.relu(self.l3(x))
        x = F.relu(self.l4(x))
        return self.l5(x)

最后一层不需要relu激活,因为需要输入到softmax中。

3.创建模型,调用损失函数和优化器
#创建模型
mymodel = Net()
#创建损失函数
loss_func = torch.nn.CrossEntropyLoss()
#创建优化器
optimizer = torch.optim.SGD(mymodel.parameters(),lr=0.01,momentum=0.5)

这里选用的损失函数是交叉熵函数CrossEntropyLoss,优化器optimizer 选用的是SGD(随机梯度下降),关于SGD里面的参数可以参考pytorch官网API:torch.optim

4.对模型进行训练
def train(epoch):
    running_loss = 0.0
    for batch_idex,data in enumerate(train_dataloader,0):
        inputs,targets = data
        optimizer.zero_grad() #清零操作要在优化器优化之前

        outputs = mymodel(inputs)
        loss = loss_func(outputs,targets)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        if batch_idex % 300 ==299:             #epoch+1是因为epoch是从0开始的
            print('[%d,%5d] loss:%.3f' % (epoch + 1,batch_idex+1,running_loss/300))
            running_loss = 0.0
   

将一轮循环封装成一个train函数,方便使用,也提高了代码的简洁性。

训练步骤可以分为三步:
1.正向传播
2.反向传播
3.更新参数

其中需要注意的几个问题:
1.在每次调用正向传播之后需要optimizer.zero_grad()进行梯度清零操作,不然梯度就会不断累加。
2.running_loss 是用来记录累计的loss值,累加loss直接用loss.item(),不然的话就是计算图,用item取出就是数值。
3.打印操作不需要每次都打印,可以用if来控制打印周期

最后进行测试操作
def test():
    correct = 0
    total = 0
    with torch.no_grad():
        for data in test_dataloader:
            inputs,targets = data
            outputs = mymodel(inputs)
            _,predicted = torch.max(outputs.data,dim=1)
            total += targets.size(0)
            correct += (predicted == targets).sum().item()
    print('Accuracy on test set:%d %% ' % (100 * correct/total))

test里面就不需要进行反向传播,只需要进行正向,所以用no_grad()来取消梯度:

with torch.no_grad():

_,predicted = torch.max(outputs.data,dim=1)返回的是两个值,分别是测试数据中每行中的最大值和最大值下标,dim = 1 表示行,dim = 0表示列。

labels.size(0)返回的元组,size(0)表示取元组的第一个数,这里labels.size(0)返回的是N。

最后用正确的个数除以总的个数,得到准确率。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值