使用Pytorch实现多层感知机

线性模型可能会出错

前面我们使用深度学习神经网络完成了线性回归,softmax回归。但是它们的网络结构都较为简单,仅仅是含有一个Linear。这就需要对我们的输入和输出的关系有较为严格的要求–线性相关。但是大多数时候,这个关系显然是不满足的。所以我们需要引入一个新的神经网络层,使得它能够构建更加复杂的函数模型。

隐藏层

我们可以通过在网络中加入一个或多个隐藏层来克服线性模型的限制, 使其能处理更普遍的函数关系类型。 要做到这一点,最简单的方法是将许多全连接层堆叠在一起。 每一层都输出到上面的层,直到生成最后的输出。 我们可以把前L-1层看作表示,把最后一层看作线性预测器。 这种架构通常称为多层感知机(multilayer perceptron),通常缩写为MLP。

万能逼近定理

定义:一个包含足够多隐含层神经元的多层前馈网络,能以任意精度逼近任意预定的连续函数。
也就是说无论输入和输出之间存在一个多么复杂的函数关系式,我们总能使用足够的隐藏层来近似地逼近它,只要函数关系是连续的。

隐藏层的具体实现

有了以上解释以及定理的加持,我们知道的神经网络的“万能性”。但是我们具体应该如何去实现呢?

激活函数

激活函数(activation function)通过计算加权和并加上偏置来确定神经元是否应该被激活, 它们将输入信号转换为输出的可微运算。 大多数激活函数都是非线性的。 由于激活函数是深度学习的基础,下面简要介绍一些常见的激活函数。

常见的激活函数有:ReLu函数
Sigmoid函数
Tanh函数
它们各自有各自的特性,在具体使用时我们会做进一步地补充。

多层感知机的简洁实现

我们仍然基于Fashion-MNIST数据集,对于这个图像分类问题,使用感知机进行实现。

import torch
from torch import nn
from d2l import torch as d2l

batch_size = 256
train_iter,test_iter = d2l.load_data_fashion_mnist(batch_size)

net = nn.Sequential(nn.Flatten(),
                   nn.Linear(784,256),
                   nn.ReLU(),
                   nn.Linear(256,10))

def init_weight(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight,std=0.01)
net.apply(init_weight)

lr,num_epochs = 0.1,10
loss = nn.CrossEntropyLoss()
trainer = torch.optim.SGD(net.parameters(),lr=lr)
d2l.train_ch3(net,train_iter,test_iter,loss,num_epochs,trainer)
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
使用PyTorch实现多层感知机(Multilayer Perceptron, MLP)是一种常见的神经网络模型。下面是一个简单的示例代码: ```python import torch import torch.nn as nn # 定义多层感知机模型 class MLP(nn.Module): def __init__(self, input_size, hidden_size, output_size): super(MLP, self).__init__() self.fc1 = nn.Linear(input_size, hidden_size) # 第一层全连接层 self.relu = nn.ReLU() # 激活函数 self.fc2 = nn.Linear(hidden_size, output_size) # 第二层全连接层 def forward(self, x): out = self.fc1(x) out = self.relu(out) out = self.fc2(out) return out # 创建模型实例 input_size = 784 # 输入大小,MNIST数据集的图片大小为28x28=784 hidden_size = 256 # 隐藏层大小 output_size = 10 # 输出大小,MNIST数据集有10个类别 model = MLP(input_size, hidden_size, output_size) # 定义损失函数和优化器 criterion = nn.CrossEntropyLoss() # 交叉熵损失函数 optimizer = torch.optim.SGD(model.parameters(), lr=0.01) # 随机梯度下降优化器 # 训练模型 num_epochs = 10 # 训练轮数 for epoch in range(num_epochs): for images, labels in train_loader: # 遍历训练数据集 images = images.reshape(-1, 28*28) # 将图片展平为向量 outputs = model(images) # 前向传播 loss = criterion(outputs, labels) # 计算损失 optimizer.zero_grad() # 梯度清零 loss.backward() # 反向传播 optimizer.step() # 更新参数 # 使用模型进行预测 with torch.no_grad(): correct = 0 total = 0 for images, labels in test_loader: # 遍历测试数据集 images = images.reshape(-1, 28*28) outputs = model(images) _, predicted = torch.max(outputs.data, 1) # 获取预测结果 total += labels.size(0) correct += (predicted == labels).sum().item() accuracy = correct / total print('Accuracy: {:.2f}%'.format(accuracy * 100)) ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值