pytorch-nn.Module

最新推荐文章于 2025-08-17 13:11:49 发布

wyw0000

最新推荐文章于 2025-08-17 13:11:49 发布

阅读量1.1k

点赞数 18

CC 4.0 BY-SA版权

分类专栏： pytorch 文章标签： pytorch 人工智能 python

本文链接：https://blog.csdn.net/wyw0000/article/details/139486236

1. nn.Module

是所有nn.类的父类，其中包括nn.Linear nn.BatchNorm2d nn.Conv2d nn.ReLU nn.Sigmoid等等

2. nn.Sequential容器

如下图，定义一个net网络，将所有继承自nn.Module的子类定义的网络层加入到了nn.Sequential容器中，与一层一层的单独调用模块组成序列相比，nn.Sequential() 可以允许将整个容器视为单个模块（即相当于把多个模块封装成一个模块），forward()方法接收输入之后，nn.Sequential()按照内部模块的顺序自动依次计算并输出结果。因此可以利用nn.Sequential()搭建模型架构。

在这里插入图片描述

3. 网络参数parameters

如下图，通过net.parameters()可以获取到net的参数，转换成list后，通过index访问第几个参数，比如：图中的list(net.named_parameters())[0]就可以获取到网络的第一个参数，也就是网络第一层的w参数。
通过list(net.named_parameters()).items()获取到所有网络层，从获取结果可以看到，每一层都被pytorch命名了，比如：‘0.weight’,‘0.bias’,即第一层网络的weight和bias.
在这里插入图片描述

4. Modules内部管理

与根节点相连的直系亲属叫children，其他再与children连接的节点都叫modules
如下图，nn.Sequential是Net的children，其他的是modules，包括nn.ReLU、nn.Linear、BasicNet
在这里插入图片描述
从下面这张截图可以看出，Net本身和Children也都是modules

5. checkpoint

为了防止train过程意外停止，需从头train的问题，train过程需要定期保持checkpoint，而一旦出现train意外停止，就可以从最后一次checkpoint接着训练。
torch.save保存checkpoint
torch.load_state_dict(torch.load(‘chpt.md’))用于load checkpoint
在这里插入图片描述

6. train/test状态切换

所有nn.类都继承自nn.Module，因此在切换train和test状态时，只需要调用一次net.train()或net.eval即可，而不需要那些train和test（dropout）行为不一致的类每个单独去切换.
在这里插入图片描述

6. 实现自己的网络层

6.1 实现打平操作

全连接层层需要打平输入，打平操作通过.view方法实现，由于Flatten继承自nn.Module，因此可以直接放到nn.Sequential中。
在这里插入图片描述

6.2 实现自己的线性层

通过net.parameters()可以将网络参数加到优化器中。
在这里插入图片描述
troch.tensor是不会自动加到nn.parameters中，因此需要使用nn.Parameter将tensor加到nn.parameters，从而才能加到SGD等优化器中。