深度学习-多层感知机的简洁实现

最新推荐文章于 2024-10-11 20:38:42 发布

仙女也秃头

最新推荐文章于 2024-10-11 20:38:42 发布

阅读量410

点赞数 2

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/z_mawkish/article/details/105370633

版权

深度学习专栏收录该内容

7 篇文章 4 订阅

订阅专栏

多层感知机的简洁实现，如何调整代码，由一个隐藏层变为三个隐藏层
一个隐藏层

#导入所需的包或模块
import torch
from torch import nn
from torch.nn import init#nn模型中初始化模块
import numpy as np
import sys
sys.path.append("..")
import d2lzh_pytorch as d2l
print(torch.__version__)

#定义模型（一个隐藏层）
num_inputs,num_outputs,num_hiddens=784,10,256
#序列模型
net=nn.Sequential(
      d2l.FlattenLayer(),#实现对x形状的转换
      nn.Linear(num_inputs,num_hiddens),#HW1+b1
      nn.ReLU(),#H=ReLU(XW+b)
      nn.Linear(num_hiddens,num_outputs),#HW2+b2
      )
for params in net.parameters():
    init.normal_(params,mean=0,std=0.01)#参数初始化

#读取数据并训练模型
batch_size=256
train_iter,test_iter=d2l.load_data_fashion_mnist(batch_size)
loss=torch.nn.CrossEntropyLoss()
optimizer=torch.optim.SGD(net.parameters(),lr=0.1)
num_epochs=10
d2l.train_ch3(net,train_iter,test_iter,loss,num_epochs,batch_size,None,None,optimizer)

三个隐藏层
更改为三个隐藏层，只需要把一个隐藏层中定义模型的代码部分换成如下代码即可。

num_inputs,num_outputs,num_hiddens1,num_hiddens2,num_hiddens3=784,10,256,256,256
#序列模型
net=nn.Sequential(
      d2l.FlattenLayer(),#实现对x形状的转换
      nn.Linear(num_inputs,num_hiddens1),
      nn.ReLU(),
      nn.Linear(num_hiddens1,num_hiddens2),
      nn.ReLU(),
      nn.Linear(num_hiddens2,num_hiddens3),
      nn.ReLU(),
      nn.Linear(num_hiddens3,num_outputs),
      )
for params in net.parameters():
    init.normal_(params,mean=0,std=0.01)#参数初始化