哪个大佬帮忙看看这是什么情况，代码素材来自李沐的softmax简洁实现和多层感知机的简洁实现

最新推荐文章于 2024-09-12 21:52:08 发布

TingYunJue

最新推荐文章于 2024-09-12 21:52:08 发布

阅读量162

点赞数

分类专栏：机器学习文章标签：深度学习 pytorch 神经网络

本文链接：https://blog.csdn.net/TingYunJue/article/details/126906893

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(nn.Flatten(),
nn.Linear(784,256),
nn.ReLU(),
nn.Linear(256,10))

def init_weights(m):
if type(m) == nn.Linear:
nn.init.normal_(m.weight,std=0.01)
net.apply(init_weights);

batch_size,lr,num_epochs =256, 0.1, 10
loss = nn.CrossEntropyLoss(reduction='none')
trainer = torch.optim.SGD(net.parameters(),lr=lr)

train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
d2l.train_ch3(net,train_iter,test_iter,loss,num_epochs,trainer)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

TingYunJue

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

《动手学深度学习》softmax回归的简洁实现（李沐）

qq_45894227的博客

09-13

811

使用深度学习框架的高级API，我们可以更简洁地实现softmax回归

李沐-动手学深度学习-多层感知机的实现

qq_60678226的博客

06-06

643

简单介绍了多层感知机的原理，及各个层之间的对应关系，多层感知机的代码实现。

参与评论您还未登录，请先登录后发表或查看评论

跟李沐学AI--深度学习之感知机

weixin_56368033的博客

08-21

200

跟李沐学AI--深度学习之感知机

在李沐老师深度学习的softmax从零实现和多层感知机从零实现环节出现的一些报错

caofu9551的博客

05-26

303

不少小伙伴在运行下面这段代码的时候会出现报错：[WinError 5] 拒绝访问。: '../data'关于这个报错的处理方式就是：这个问题可以尝试退出jupyter 然后用管理员身份运行就可以了。运行以后再输入那段代码就可以处理这个问题了。

Pytorch 中torch.nn.Linear的权重初始化

热门推荐

D_handsome的博客

01-27

2万+

最近学习李沐老师pytorch课程，在software回归一节中模型建立首先进行初始化参数（权重……），课程代码如下： net = nn.Sequential(nn.Flatten(), nn.Linear(784, 10)) #nn.Flatten将多维张量压缩为二维（一行）进而进行线性操作、 def init_weights(m): if type(m) == nn.Linear: nn.init.normal_(m.weight, std=0.01) net.app

pytorch初始化参数方法

m0_58313777的博客

08-19

2056

pytorch初始化参数方法来源动手学深度学习

神经网络与深度学习第一周学习

m0_73567196的博客

03-22

198

在有监督的模型中，即所有的训练数据均已被标注好，也就是已知训练数据的真实属性，通过神经网络对训练数据进行前向推理，得到一个训练数据的推理结果，然后如果神经网络的训练不足，极大可能就会将数据推理错误，那么训练数据的推理结果与真实结果之间就会存在差异，这个差异通常使用损失Loss来表示。线性回归基于几个简单的假设：首先，假设自变量x和因变量y之间的关系是线性的，即y可以表示为x中元素的加权和，这里通常允许包含观测值的一些噪声。这个过程就是前向传播，也是我们训练神经网络的目的，即实现神经网络对输入数据的推理。

李沐深度学习第四章多层感知机总结

07-26

通过逐步解析感知机和多层感知机的工作原理及其实现细节，读者能够更好地理解和应用这类模型来解决实际问题。同时，文章也强调了在模型选择和评估过程中需要注意的关键因素，帮助读者在实践中做出更明智的决策。

李沐softmax回归简洁实现解释

09-27

李沐softmax回归的简洁实现使用了PyTorch框架中的torch.nn模块和torch.nn.functional模块。首先，需要使用torch.nn.Module类创建一个自定义模型。在这个模型中，使用torch.nn.Linear函数定义一个线性层，将输入特征...

李沐 softmax回归的简洁实现【动手学深度学习v2】

最新发布

m0_73177878的博客

09-12

956

通过深度学习框架的高级API能更方便地实现softmax回归模型。本节同 :numref:，继续使用Fashion-MNIST数据集，并保持批量大小为256。softmax回归的输出层是一个全连接层，因此，为了实现我们的模型，我们只需在中添加一个带有10个输出的全连接层。同样，在这里并不是必要的，但它是实现深度模型的基础。我们仍然以均值0和标准差0.01随机初始化权重。： PyTorch不会隐式地调整输入的形状。因此，在线性层前定义了展平层（flatten）来调整网络输入的形状。：这是一个全连接层

Pytorch深度学习笔记④：Softmax回归的简洁实现

qq_53635921的博客

12-08

1494

本文是《动手学深度学习课程》中Softmax回归简洁实现的笔记，仅用于个人学习记录。 Softmax回归的简洁实现：首先导入需要使用的包，并设置好batch-size，以及得出训练集和测试集 import torch from torch import nn from d2l import torch as d2l batch_size = 256 train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size) 接着可以定义模型，

Pytorch学习之神经网络参数管理

ting_qifengl的博客

05-25

2760

这里记录一下pytorch神经网络参数管理方法(参数访问、参数初始化、参数绑定)，方便自己和需要的朋友学习、查阅。一、参数访问 1.1 访问指定层的指定参数首先构建一个多层感知机。 import torch from torch import nn net = nn.Sequential(nn.Linear(2, 4), nn.ReLU(), nn.Linear(4, 1)) X = torch.rand(size=(2, 2)) 当通过nn.Sequential定义模型时，我们可以通过

已解决！李沐深度学习pip install d2l提示ERROR: Could not build wheels for pandas

weixin_46031067的博客

08-16

1232

遇到这个问题后选择在下载d2l的whl文件到本地安装，安装成功，但是由于版本太低导致一些函数用不了，在使用train_ch3时报错。于是我尝试下载和书上配套的0.17.6版本到本地进行安装，但是还是报标题所示的问题，于是尝试下载pandas的whl文件到本地安装。在这个环境下重新下载所需要的d2l，torch以及torchvision问题就得到解决。在Anconda中创建虚拟环境设置为python3.9。

解决pytorch中执行图像不显示报错的问题

颈椎小问题老奶奶的博客

01-05

337

在图像识别之前改变matplotlib的版本。

深度学习——参数管理（笔记）

jbkjhji的博客

11-25

1063

个人猜测不一定对:weight是8*4的原因，输入是4个维度，每个维度就有4个权重。输出是8个维度了，要带着前面输入的维度的4个权重，所以就是8*4]net.apply(init_normal) 的说明：遍历net的所有层，如果是Linear层，就进行权重和偏置的初始化修改。2.查看全部参数访问：获取权重和偏置。指定层的参数 net[2]就是 nn.Linear(8, 1)输出：tensor([-0.0795])4.访问指定net[0]层的参数。3.指定参数的访问--偏置。6.指定特征名称的值的数据。

[pytorch]手动构建一个神经网络并且训练

weixin_62697030的博客

11-05

1359

一点简单的小小总结：1.首先是关于net：net可以接受小批量，甚至是一个完整那个的数据list的输入的，也就是说我们传入的小批量其实是[256,1,28,28]然后我们最终的输出结果为[256,1],虽然这不是我们要的东西其实net本质就是一个张量处理机，’压缩‘成需要的格式张量处理机：一开是的猜测是会根据批量逐一处理那些张量，但是事实是net本身并不会对其进行太多的区分传入进来的仍然是一个整体张良，需要在net中自己操作dim得到需要的结果以及形式。

【动手学深度学习】关于“softmax回归的简单实现”报错的解决办法（含源代码）

wzk4869的博客

11-21

2045

【动手学深度学习】关于“softmax回归的简单实现”报错的解决办法（含源代码）

李沐-多层感知机,优化方案

hlhwna的博客

04-04

331

4.l2正则化本质就是加了一个平方惩罚项，其他类似，唯独在给优化算法输入参数时加入调用正则化系数：trainer = torch.optim.SGD([{"params":net[0].weight,##"weight_decay":wd##这里对weight使用正则化##}，{"params":net[0].bias}],lr)对比：trainer = torch.optim.SGD(net.parameters(), lr=lr)这里就没有包含正则化项。1.mlp-全连接层-每个输入均影响输出。

为了小论文之跟着李沐学AI(四)

qq_36309174的博客

11-13

561

这篇文章是多层感知机的使用对于这张图的理解比如我们的输入为[x1,x2,x3…,xn]是一个n1的矩阵我们的隐藏层w1是一个mn的矩阵 w1 * input = m1的矩阵加上我们的偏执b是一个m1的矩阵最后再和w2一个1*m的矩阵你发现做来做去都是线性变换，其实直接代入一般的数学公式也能看出来我们算来算去都在算一个线性变化，但是我们之前已经学习过了，一个线性变换一个等式就能完成，那何必多次依据呢。关键就在于激活函数，我们需要一个非线性的函数，来帮我们了解，一个输出不止有正类负类两种类