Dive into deep learning(04)[动手学深度学习]———————第四章深度学习计算

梦想实干家杭77

已于 2022-10-11 22:59:05 修改

阅读量512

点赞数

文章标签：深度学习 python 人工智能

于 2022-10-10 01:25:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52542715/article/details/127188479

版权

文章目录

- Dive into deep learning(04)[动手学深度学习]———————第四章，深度学习计算

Dive into deep learning(04)[动手学深度学习]———————第四章，深度学习计算

前言：论文初稿算是结束了。感觉自己效率还有待提高。

本章摘要： 这章主要是介绍怎么构造层，参数访问，怎么储存输入输出，怎么使用gpu等等基础内容。

1、层和块(model-construction)

一个块可以由许多层组成；一个块可以由许多块组成。
块可以包含代码。
块负责大量的内部处理，包括参数初始化和反向传播。
层和块的顺序连接由Sequential块处理。

作业：
作业都挺简单的，值得注意的是，dict相较于list的存储优势在于保存了序列。

函数记录：

chimera = nn.Sequential(NestMLP(), nn.Linear(16, 20), FixedHiddenMLP())##这个函数用来对层和块顺序连接

2、参数管理(parameters)

主要是怎么读取参数，类似于weight，bias这些。
还有参数初始化
作业：

函数记录：
net[2].state_dict()###读取网络中第三个模块的相关数据
net[2].bias##读取网络中第三个模块的偏置实例，注意是实例，包含了数据，梯度等信息
net[2].bias.data##读取网络中第三个模块的偏置数据
net[2].weight.grad##读取网络中第三个模块的权重梯度
print(*[(name, param.shape) for name, param in net.named_parameters()])##获取参数名字和形状
net.state_dict()['2.bias'].data##读取网络中第三个模块的偏置数据（另一种方式）
net.add_module(f'block {i}',

最低0.47元/天解锁文章

梦想实干家杭77

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Dive into deep learning(04)[动手学深度学习]———————第四章深度学习计算

Dive into deep learning(04)[动手学深度学习]———————第四章深度学习计算
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。