【PyTorch】实现多层感知机的构建

最新推荐文章于 2023-06-27 12:27:14 发布

带鱼的鱼香肉丝

最新推荐文章于 2023-06-27 12:27:14 发布

阅读量652

点赞数

分类专栏：深度学习 pytorch 文章标签：深度学习 python pytorch 神经网络

本文链接：https://blog.csdn.net/qq_43169650/article/details/113133333

版权

pytorch 同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

深度学习

6 篇文章 0 订阅

订阅专栏

【PyTorch】实现多层感知机的构建

1.引入相关的包

import torch
import sys
sys.path.append("..")
import torch.nn as nn
import torchvision
import torch.utils.data as Data
import torchvision.transforms as transforms
import matplotlib.pyplot as plt

这些包有大部分是pytorch自带的，其中matplotlib是一个用来画图的包，在这里我们需要用到。

2.获取fashion-mnist数据集

其中数据集下载的位置如下，自己可以做相关调整。

C:\Users\15347\Datasets\FashionMNIST

第一次下载数据集的时候，需要一段时间。再次运行的时候，数据集已经下载就不要时间了。其中第一次运行时，一定注意把这个属性设置为True,download=True，之后变可以设置为download=False。

mnist_train = torchvision.datasets.FashionMNIST(
    root='~/Datasets/FashionMNIST', train=True, download=True, transform=transforms.ToTensor())
mnist_test = torchvision.datasets.FashionMNIST(
    root='~/Datasets/FashionMNIST', train=False, download=True, transform=transforms.ToTensor())

3.初始化batch_size，数据集类别

batch_size = 256
class_name = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
              'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

4.获得数据

下面是获得测试集和训练集

batch_size = 256
class_name = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
              'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']if sys.platform.startswith('win'):
    num_workers = 0
else:
    num_workers = 4
train_iter = torch.utils.data.DataLoader(
    mnist_train,batch_size=batch_size, shuffle=True, num_workers=num_workers)
test_iter = torch.utils.data.DataLoader(
    mnist_test,batch_size=batch_size, shuffle=True, num_workers=num_workers)

5.定义网络模型

定义模型前，首先需要确定输入层，隐藏层，输出层的节点个数。
在这里我是构建了两个隐藏层，关于节点个数的选择，大家可以参考其他知识。

每个样本输入是高和宽均为28像素的图像。模型的输入向量的长度是 28×28=784：该向量的每个元素对应图像中每个像素。由于图像有10个类别，单层神经网络输出层的输出个数为10，因此softmax回归的权重和偏差参数分别为784×10和1×10的矩阵。

num_inputs,num_outputs,num_hiddens1,num_hiddens2= 784,10,256,256

定义网络参数模型，初始化模型参数，代码片段如下：

class FlattenLayer(nn.Module):
    def __init__(self):
        super(FlattenLayer,self).__init__()
    def forward(self,x):
        return x.view(x.shape[0],-1)
net = nn.Sequential(
    FlattenLayer(),
    nn.Linear(num_inputs, num_hiddens1),
    nn.ReLU(),
    nn.Dropout(drop_prob1),
    nn.Linear(num_hiddens1, num_hiddens2),
    nn.ReLU(),
    nn.Dropout(drop_prob2),
    nn.Linear(num_hiddens2,num_outputs)
)
for param in net.parameters():
    nn.init.normal_(param, mean=0, std=0.01)

6.对模型的精度进行评估

def evaluate_accuracy(data_iter,net):
    acc_sum,n = 0.0,0
    for X,y in data_iter:
        if isinstance(net,torch.nn.Module):
            net.eval()
            acc_sum += (net(X).argmax(dim=1)==y).float().sum().item()
            net.train()
        else:
            if ('is_training' in net.__code__.co_varnames):
                acc_sum += (net(X,is_training = False).argmax(dim=1)==y).float().sum()
            else:
                acc_sum += (net(X).argmax(dim=1) == y).float().sum().item()
        n += y.shape[0]
    #返回准确的元素概率
    return acc_sum / n

7.画图函数的定义

def semilogy(x_vals, y_vals, x_label, y_label, x2_vals=None, y2_vals=None,
             legend=None):
    plt.xlabel(x_label)
    plt.ylabel(y_label)
    plt.semilogy(x_vals, y_vals)
    if x2_vals and y2_vals:
        plt.semilogy(x2_vals, y2_vals, linestyle=':')
        plt.legend(legend)
    plt.show()

8.训练模型

这里需要给大家解释一下，为何学习率的选择是100，如此大。

原书的mxnet中的SoftmaxCrossEntropyLoss在反向传播的时候相对于沿batch维求和了，而PyTorch默认的是求平均，所以用PyTorch计算得到的loss比mxnet小很多（大概是maxnet计算得到的1/batch_size这个量级），所以反向传播得到的梯度也小很多，所以为了得到差不多的学习效果，我们把学习率调得成原书的约batch_size倍，原书的学习率为0.5，这里设置成100.0。(之所以这么大，应该是因为d2lzh_pytorch里面的sgd函数在更新的时候除以了batch_size，其实PyTorch在计算loss的时候已经除过一次了，sgd这里应该不用除了)

num_epochs,lr = 20,100
def train_softmax(net,train_iter,test_iter,loss,num_epochs,batch_size,
                  params=None, lr=None, optimizer=None):
    loss_list,train_list,test_list = [],[],[]

    for epoch in range(num_epochs):
        #损失值、正确数量、总数 初始化
        train_loss_sum,train_acc_sum,n = 0.0,0.0,0

        for X,y in train_iter:
            y_hat = net(X)
            l = loss(y_hat,y).sum()

            # 梯度清零 损失函数和优化函数梯度清零
            if optimizer is not None:
                optimizer.zero_grad()
            elif params is not None and params[0].grad is not None:
                for param in params:
                    param.grad.data.zero_()

            l.backward()
            if optimizer is None:
                sgd(params, lr, batch_size)
            else:
                optimizer.step()

            train_loss_sum += l.item()
            train_acc_sum +=(y_hat.argmax(dim=1)==y).sum().item()
            n += y.shape[0]

        test_acc = evaluate_accuracy(test_iter,net)
        loss_list.append(train_loss_sum/n)
        train_list.append(train_acc_sum/n)
        test_list.append(test_acc)
        print('epoch %d, loss %.4f, train acc %.3f,test acc %.3f'
              %(epoch+1,train_loss_sum/n,train_acc_sum/n,test_acc))

    semilogy(range(1, num_epochs + 1), train_list, 'epochs', 'loss',
             range(1, num_epochs + 1), test_list, ['train', 'test'])
    return loss_list,train_list,test_list

9.代入运行

loss = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(net.parameters(),lr=0.5)
train_softmax(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None, optimizer)

10.运行结果

有关每次计算后的损失、测试、训练率的大小如下：

epoch 1, loss 0.0044, train acc 0.561,test acc 0.720
epoch 2, loss 0.0023, train acc 0.786,test acc 0.790
epoch 3, loss 0.0019, train acc 0.824,test acc 0.766
epoch 4, loss 0.0017, train acc 0.840,test acc 0.781
epoch 5, loss 0.0016, train acc 0.848,test acc 0.837
epoch 6, loss 0.0015, train acc 0.859,test acc 0.854
epoch 7, loss 0.0015, train acc 0.863,test acc 0.852
epoch 8, loss 0.0014, train acc 0.868,test acc 0.852
epoch 9, loss 0.0014, train acc 0.872,test acc 0.862
epoch 10, loss 0.0013, train acc 0.875,test acc 0.843
epoch 11, loss 0.0013, train acc 0.878,test acc 0.840
epoch 12, loss 0.0013, train acc 0.881,test acc 0.868
epoch 13, loss 0.0012, train acc 0.883,test acc 0.868
epoch 14, loss 0.0012, train acc 0.887,test acc 0.851
epoch 15, loss 0.0012, train acc 0.887,test acc 0.876
epoch 16, loss 0.0012, train acc 0.888,test acc 0.865
epoch 17, loss 0.0012, train acc 0.890,test acc 0.871
epoch 18, loss 0.0011, train acc 0.893,test acc 0.875
epoch 19, loss 0.0011, train acc 0.895,test acc 0.862
epoch 20, loss 0.0011, train acc 0.896,test acc 0.880

代码最后运行结果画出图像如下：

在这里插入图片描述

参考内容

动手学深度学习pytorch实现这本书：https://tangshusen.me/Dive-into-DL-PyTorch/#/

带鱼的鱼香肉丝

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【PyTorch】实现多层感知机的构建

【PyTorch】实现多层感知机的构建1.引入相关的包2.获取fashion-mnist数据集3.初始化batch_size，数据集类别4.获得数据5.定义网络模型6.对模型的精度进行评估7.画图函数的定义8.训练模型9.代入运行10.运行结果参考内容1.引入相关的包import torchimport syssys.path.append("..")import torch.nn as nnimport torchvisionimport torch.utils.data as Datai
复制链接

扫一扫