动手深度学习笔记（二十七）5.3. 延后初始化

最新推荐文章于 2023-10-06 15:03:47 发布

落花逐流水

最新推荐文章于 2023-10-06 15:03:47 发布

阅读量170

点赞数

分类专栏： pytorch实践 pytorch 文章标签： pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/juluwangriyue/article/details/123340356

版权

pytorch实践同时被 2 个专栏收录

136 篇文章 114 订阅 ¥29.90 ¥99.00

订阅专栏

94 篇文章 12 订阅

订阅专栏

本文介绍了深度学习框架中的延后初始化机制，允许在未知输入维度的情况下定义网络。当数据首次通过模型时，框架会动态推断各层大小。通过实例展示了在PyTorch中如何实现这一功能，强调了初始化参数的重要性，并探讨了在不同情况下如何处理输入维度的变化。

摘要由CSDN通过智能技术生成

动手深度学习笔记（二十七）5.3. 延后初始化

5. 深度学习计算
- 5.3. 延后初始化

5. 深度学习计算

5.3. 延后初始化

到目前为止，我们忽略了建立网络时需要做的以下这些事情：

我们定义了网络架构，但没有指定输入维度。
我们添加层时没有指定前一层的输出维度。
我们在初始化参数时，甚至没有足够的信息来确定模型应该包含多少参数。

你可能会对我们的代码能运行感到惊讶。毕竟，深度学习框架无法判断网络的输入维度是什么。这里的诀窍是框架的延后初始化（defers initialization），即直到数据第一次通过模型传递时，框架才会动态地推断出每个层的大小。

在以后，当使用卷积神经网络时，由于输入维度（即图像的分辨率）将影响每个后续层的维数，有了该技术将更加方便。现在我们在编写代码时无须知道维度是什么就可以设置参数，这种能力可以大大简化定义和修改模型的任务。接下来，我们将更深入地研究初始化机制。

5.3.1. 实例化网络

首先，让我们实例化一个多层感知机。
此处没有pytorch代码，可能是跟mxnet和tensorflow不一样的地方。(pytorch支持的，了解一下nn.LazyLinear，但是PyTorch的这个功能正处于开

了解本专栏

落花逐流水

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
动手深度学习笔记（二十七）5.3. 延后初始化

动手深度学习笔记（二十七）5.3. 延后初始化5. 深度学习计算5.3. 延后初始化5.3.1. 实例化网络5.3.2. 小结5.3.3. 练习5. 深度学习计算5.3. 延后初始化到目前为止，我们忽略了建立网络时需要做的以下这些事情：我们定义了网络架构，但没有指定输入维度。我们添加层时没有指定前一层的输出维度。我们在初始化参数时，甚至没有足够的信息来确定模型应该包含多少参数。你可能会对我们的代码能运行感到惊讶。毕竟，深度学习框架无法判断网络的输入维度是什么。这里的诀窍是框架的延后初始
复制链接

扫一扫

专栏目录

落花逐流水

CSDN认证博客专家 CSDN认证企业博客

码龄9年

765: 原创

1万+: 周排名

2657: 总排名

123万+: 访问

: 等级

9860: 积分

1068: 粉丝

772: 获赞

416: 评论

3830: 收藏

私信

关注

热门文章

分类专栏

最新评论

下载B站视频作为PPT素材
穷苦书生_万事愁: 这篇博主的分享让我对“下载B站视频作为PPT素材”有了全新的认识，文章中的细节描写非常到位，让我深切感受到了博主的深厚功底。期待博主未来能够持续分享更多像这样有价值的好文，也希望能够得到博主的指导，共同进步。非常感谢博主的用心分享和支持！
Segment Anything论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Eigen库学习笔记（四）Eigen用于三维张量
落花逐流水: 好问题，我又试了一下。顺便补充了一个测试。按照索引访问是没有问题的，直接打印存在问题应该说明这个三维底层其实是用二维表示的，2组3行4列，其中3行4列被拉伸成1维了。
Eigen库学习笔记（四）Eigen用于三维张量
huangsiling123: 3维张量这个好像不对，应该是4个2行3列的矩阵吧，直接输出a的话不是这个结果
libtorch动态图占显存不断增加问题
把假发片还给我: 加上torch::NoGradGuard no_grad;

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

落花逐流水 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。