【动手学习pytorch笔记】3.单隐藏层的多层感知机(MLP)

单隐藏层的多层感知机从零实现

import torch
from torch import nn
from d2l import torch as d2l

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

还是之前的数据集fashion_mnist

初始化模型参数

num_inputs, num_outputs, num_hiddens = 784, 10, 256

W1 = nn.Parameter(torch.randn(num_inputs, num_hiddens, requires_grad=True) * 0.01)
b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad=True))
W2 = nn.Parameter(torch.randn(num_hiddens, num_outputs, requires_grad=True) * 0.01)
b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))

params = [W1, b1, W2, b2]

单隐藏层

​ W1:784 * 256

​ b1: 256 * 1

​ W2: 256 * 10

​ b2:10 * 1

激活函数Relu

def relu(X):
    a = torch.zeros_like(X)
    return torch.max(X, a)

模型

def net(X):
    X = X.reshape((-1, num_inputs))
    H = relu(X@W1 + b1)  # 这里“@”代表矩阵乘法
    return (H@W2 + b2)

W2,b2是输出层的参数,没有激活函数

X:样本数 * 784

损失函数

loss = nn.CrossEntropyLoss(reduction='none')

训练

num_epochs, lr = 10, 0.1
updater = torch.optim.SGD(params, lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, updater)

在这里插入图片描述

单隐藏层的多层感知机简易实现

import torch
from torch import nn
from d2l import torch as d2l
net = nn.Sequential(nn.Flatten(),
                    nn.Linear(784, 256),
                    nn.ReLU(),
                    nn.Linear(256, 10))

def init_weights(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01)

net.apply(init_weights);
batch_size, lr, num_epochs = 256, 0.1, 10
loss = nn.CrossEntropyLoss(reduction='none')
trainer = torch.optim.SGD(net.parameters(), lr=lr)

train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)


在这里插入图片描述

经过了线性回归和softmax回归,上面很容易就能看懂了。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 多层感知机(Multilayer Perceptron,简称MLP)是一种最基本的前馈神经网络模型,在PyTorch中可以很方便地实现。 首先,我们需要导入PyTorch库,并设置模型的超参数,如输入特征的维度(input_size)、隐藏的维度(hidden_size)、输出的维度(output_size)、学习率(learning_rate)等。 接下来,我们可以定义一个MLP类,继承自PyTorch中的nn.Module父类。在MLP类的构造函数中,我们定义了输入隐藏和输出的全连接,并使用nn.ReLU作为激活函数。 然后,我们可以实现MLP类的前向传播函数forward。在forward函数中,我们将输入数据通过隐藏和激活函数进行计算,并将结果传递到输出,得到预测值。 接下来,我们可以定义训练函数。在训练函数中,我们首先将输入数据和标签转换为PyTorch的张量类型,并将其传递给MLP模型进行前向传播,得到预测值。然后,我们使用PyTorch提供的均方误差损失函数计算预测值与真实值之间的误差,并利用反向传播算法调整模型的参数。 最后,我们可以定义测试函数。在测试函数中,我们首先将输入数据转换为PyTorch的张量类型,并将其传递给MLP模型进行前向传播,得到预测值。然后,我们可以打印预测值并与真实值进行比较,评估模型的性能。 在主函数中,我们可以创建MLP模型实例,并调用训练函数和测试函数来训练和测试模型。 总结来说,用PyTorch实现简多层感知机MLP)需要定义一个MLP类,并在其中定义前向传播函数和训练函数,然后在主函数中创建模型实例并调用训练和测试函数。通过不断优化模型参数,我们可以提高模型的性能和准确率。 ### 回答2: 多层感知机(Multi-Layer Perceptron,简称MLP)是一种基本的人工神经网络模型,在PyTorch中可以很方便地实现。 首先,我们需要导入PyTorch库: ```python import torch import torch.nn as nn ``` 接下来,我们定义一个MLP类,并继承自nn.Module: ```python class MLP(nn.Module): def __init__(self, input_dim, hidden_dim, output_dim): super(MLP, self).__init__() self.hidden_layer = nn.Linear(input_dim, hidden_dim) self.output_layer = nn.Linear(hidden_dim, output_dim) def forward(self, x): x = torch.relu(self.hidden_layer(x)) x = self.output_layer(x) return x ``` MLP类初始化方法中,我们传入了输入维度、隐藏维度和输出维度作为参数。然后,我们在初始化方法中定义了一个隐藏和一个输出,它们都是线性变换(Linear)。 在forward方法中,我们使用ReLU作为激活函数对隐藏进行非线性变换,并将隐藏的输出作为输入传给输出。 接下来,我们可以实例化一个MLP模型并定义输入和输出的维度: ```python input_dim = 784 # 输入维度为28x28 hidden_dim = 256 # 隐藏维度为256 output_dim = 10 # 输出维度为10,对应10个类别 model = MLP(input_dim, hidden_dim, output_dim) ``` 然后,我们可以使用该模型进行前向传播计算,并得到输出: ```python input = torch.randn(64, input_dim) # 随机生成输入数据,batch_size为64 output = model(input) ``` 最后,我们可以通过定义损失函数和优化器来训练MLP模型: ```python criterion = nn.CrossEntropyLoss() # 定义交叉熵损失函数 optimizer = torch.optim.SGD(model.parameters(), lr=0.01) # 定义随机梯度下降优化器 # 训练循环 for epoch in range(num_epochs): optimizer.zero_grad() # 梯度清零 output = model(input) # 前向传播 loss = criterion(output, target) # 计算损失 loss.backward() # 反向传播 optimizer.step() # 更新参数 ``` 通过以上步骤,我们就可以使用PyTorch实现一个简多层感知机MLP)模型。 ### 回答3: 多层感知机(Multilayer Perceptron,MLP)是一种经典的神经网络模型,其在PyTorch中的实现相对简。 首先,在PyTorch中,我们可以使用`torch.nn`工具包来构建多层感知机。这个工具包提供了各种用于构建神经网络的函数和类。 要实现一个简多层感知机模型,我们首先需要定义一个继承自`torch.nn.Module`的类。在这个类中,我们通过定义不同的来构建我们的神经网络结构。 接下来,我们需要在类的构造函数中定义我们的网络结构。我们可以使用`torch.nn.Linear`类来创建全连接,它的输入参数是输入特征的维度和输出特征的维度。 然后,在类的前向传播函数`forward`中,我们需要定义数据在网络中的前向流动过程。我们可以使用不同的激活函数(例如`torch.nn.ReLU`)和池化函数(如`torch.nn.MaxPool2d`)来增加网络的非线性能力。 接下来,我们需要定义模型的损失函数和优化器。PyTorch提供了各种损失函数(如均方误差损失函数`torch.nn.MSELoss`)和各种优化器(如随机梯度下降`torch.optim.SGD`)。 在训练过程中,我们需要遍历数据集,并将数据输入到模型中进行前向传播和反向传播。在每个批次的训练中,我们需要计算损失函数,并使用优化器来更新模型的参数。 最后,我们可以通过将输入数据传递给训练好的模型,利用模型的`forward`函数来进行预测。 总结来说,通过PyTorch实现简多层感知机,我们需要定义网络结构,选择合适的损失函数和优化器,并使用训练数据来更新模型的参数,从而实现对输入数据的预测。多层感知机PyTorch中的实现相对简,同时PyTorch也提供了丰富的工具和函数来支持神经网络的构建和训练。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值