自定义块和顺序块

the animal

已于 2023-06-03 10:46:57 修改

阅读量57

点赞数

分类专栏：深度学习文章标签： pytorch

于 2023-06-01 22:43:34 首次发布

本文链接：https://blog.csdn.net/m0_46312382/article/details/130993730

版权

深度学习专栏收录该内容

23 篇文章 0 订阅

订阅专栏

块（block）可以描述单个层、由多个层组成的组件或整个模型本身。从编程的角度来看，块由类（class）表示。它的任何子类都必须定义一个将其输入转换为输出的前向传播函数，并且必须存储任何必需的参数。注意，有些块不需要任何参数。最后，为了计算梯度，块必须具有反向传播函数。

1.将输入数据作为其前向传播函数的参数。
2.通过前向传播函数来生成输出。请注意，输出的形状可能与输入的形状不同。例如，我们上面模型中的第一个全连接的层接收一个20维的输入，但是返回一个维度为256的输出。
3. 计算其输出关于输入的梯度，可通过其反向传播函数进行访问。通常这是自动发生的。
4. 存储和访问前向传播计算所需的参数。
5. 根据需要初始化模型参数。

在编写的时候，块由class定义，首先需要继承Module，然后实现__init__函数和前向传播函数

class MLP(nn.Module):
    # 用模型参数声明层。这里，我们声明两个全连接的层
    def __init__(self):
        # 调用MLP的父类Module的构造函数来执行必要的初始化。
        # 这样，在类实例化时也可以指定其他函数参数，例如模型参数params（稍后将介绍）
        super().__init__()#初始化父类init方法
        self.hidden = nn.Linear(20, 256)  # 隐藏层
        self.out = nn.Linear(256, 10)  # 输出层

    # 定义模型的前向传播，即如何根据输入X返回所需的模型输出
    def forward(self, X):
        # 注意，这里我们使用ReLU的函数版本，其在nn.functional模块中定义。
        return self.out(F.relu(self.hidden(X)))

顺序块为了实现自己的Sequential。

class MySequential(nn.Module):
    def __init__(self, *args):
        super().__init__()
        #enumerate就是枚举的意思,返回的是索引以及对应的元素
        for idx, module in enumerate(args):
            # 这里，module是Module子类的一个实例。我们把它保存在'Module'类的成员
            # 变量_modules中。_module的类型是OrderedDict(字典类型)
            self._modules[str(idx)] = module

    def forward(self, X):
        # OrderedDict保证了按照成员添加的顺序遍历它们
        #values为网络层，对其进行嵌套.X需要为float类型
        for block in self._modules.values():
            X = block(X)
        return X

嵌套块

class NestMLP(nn.Module):
    def __init__(self):
        super().__init__()
        self.net = nn.Sequential(nn.Linear(20, 64), nn.ReLU(),
                                 nn.Linear(64, 32), nn.ReLU())
        self.linear = nn.Linear(32, 16)

    def forward(self, X):
        return self.linear(self.net(X))

chimera = nn.Sequential(NestMLP(), nn.Linear(16, 20), FixedHiddenMLP())
chimera(X)

the animal

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
自定义块和顺序块

块（block）可以描述单个层、由多个层组成的组件或整个模型本身。从编程的角度来看，块由类（class）表示。它的任何子类都必须定义一个将其输入转换为输出的前向传播函数，并且必须存储任何必需的参数。注意，有些块不需要任何参数。最后，为了计算梯度，块必须具有反向传播函数。在编写的时候，块由class定义，首先需要继承Module，然后实现__init__函数和前向传播函数。顺序块为了实现自己的Sequential。
复制链接

扫一扫

专栏目录