动手学深度学习——多层感知机从零开始实现及简洁实现

多层感知机从零开始实现

#首先需要导入需要的包
import torch
import numpy as np
import sys
sys.path.append("..")
import d2lzh_pytorch as d2l

"""
1、获取数据
使用FashionMNIST数据集,使用多层感知机对图像开始分类
"""
batch_size=256 #批量大小设置为256,也就是每次读取256张图片
train_iter,test_iter =d2l.load_data_fashion_mnist(batch_size)
#设置一个训练集和测试集的迭代器

"""
2、定义模型参数
在softmax回归从零开始中,提到Fashion-MNIST数据集中的图像形状为28x28,类别数为10.
本节依然使用长度为28x28=784的向量表示每一张图像。
"""
num_inputs,num_outputs,num_hiddens=784,10,256
#输入个数784,输出个数10个,超参数隐藏单元个数256
W1=torch.tensor(np.random.normal(0,0.01,(num_inputs,num_hiddens)),dtype=torch.float)
#权重W1初始化为高斯随机分布的一个值,均值为0,方差为0.01,输入层
b1=torch.zeros(num_hiddens,dtype=torch.float)
#偏差b1就是隐藏层的个数,定义数据类型

W2=torch.tensor(np.random.normal(0,0.1,(num_hiddens,num_outputs)),dtype=torch.float)
#权重W2初始化为高斯随机分布的一个值,均值为0,方差为0.01,输出层
b2=torch.zeros(num_outputs,dtype=torch.float)
#偏差b2就是长为10的一个向量,定义数据类型


#下面是模型参数梯度,表示每一个权重w和偏差b都需要求梯度
params=[W1,b1,W2,b2]
for param in params:
    param.requires_grad_(requires_grad=True)

"""
3、定义激活函数
这里使用ReLU激活函数,使用基础的max函数实现ReLU,而非直接调用
"""
def relu(X):
    return torch.max(input=X,other=torch.tensor(0.0))
    #将输入给X

"""
4、定义模型
实现上一节中多层感知机的计算表达式
"""
def net(X):
    X=X.view((-1,num_inputs))
    #使用view函数将每张原始图像改成长度为NUM_inputs的向量
    H=relu(torch.matmul(X,W1)+b1) #先做乘法 输入乘以W1在加上b1
    return torch.matmul(H,W2)+b2
    #第一层的输出和第二层的权重做乘法再加上第二层的偏差

"""
5、定义损失函数
"""
loss =torch.nn.CrossEntropyLoss()

"""
6、训练模型
多层感知机的训练过程和softmax回归的训练过程是一样的
我们直接调⽤ d2lzh_pytorch包中的 train_ch3 函数,
"""
num_epochs,lr=5,100.0 #设置超参数迭代周期为5,学习率为100.0
d2l.train_ch3(net,train_iter,test_iter,loss,num_epochs,batch_size,params,lr)

 

多层感知机简洁实现

import torch
from torch import nn
from torch.nn import init
import numpy as np
import sys
sys.path.append("..")
import d2lzh_pytorch as d2l

#1、定义模型
#和softmax回归唯⼀的不同在于,我们多加了⼀个全连接层作为隐藏层
num_inputs, num_outputs, num_hiddens = 784, 10, 256
net = nn.Sequential(
    d2l.FlattenLayer(),#隐藏层
    nn.Linear(num_inputs, num_hiddens), #线性层
    nn.ReLU(),
    nn.Linear(num_hiddens, num_outputs),
)
for params in net.parameters():
    init.normal_(params, mean=0, std=0.01)
#2、读取数据并训练模型
batch_size = 256 #批量大小256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
loss = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(net.parameters(), lr=0.5)
#由于这⾥使⽤的是PyTorch的SGD⽽不是d2lzh_pytorch⾥⾯的sgd,所以就不存在上面那样学习率看起来很⼤的问题了
num_epochs = 5
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs,batch_size, None, None, optimizer)

 

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
动手深度学习感知机从零开始的步骤如下: 1. 导入所需的包或模块,包括torch、numpy和d2lzh_pytorch等。 2. 获取和读取数据,可以使用Fashion-MNIST图像分类数据集作为训练和测试数据集。 3. 初始化模型参数,包括输入层维度、隐藏层维度和输出层维度等。这些参数可以根据具体情况进行设置。 4. 定义激活函数,可以使用ReLU等常见的激活函数。 5. 定义模型结构,包括输入层、隐藏层和输出层等。在每一层之间都可以加上激活函数。 6. 定义损失函数,可以使用交叉熵损失函数等。 7. 训练模型,可以使用梯度下降等优化算法进行模型参数的更新。训练过程中可以设置迭代周期数和习率等超参数。 8. 输出结果,可以使用准确率等指标来评估模型的性能。 9. 使用预测函数进行预测,将输入数据输入模型,得到对应的预测结果。 以上是从零开始实现多层感知机的步骤。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [【动手深度学习多层感知机从零开始实现(含源代码)](https://blog.csdn.net/wzk4869/article/details/127984842)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [【从零开始深度学习】10.自己动手从零开始实现一个多层感知机](https://blog.csdn.net/qq_42589613/article/details/128187230)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值