自定义层和快

最新推荐文章于 2024-01-29 22:50:06 发布

菜小鸡同志要永远朝光明前进

最新推荐文章于 2024-01-29 22:50:06 发布

阅读量105

点赞数

分类专栏：动手学深度学习+pytorch 文章标签： html 神经网络深度学习 pytorch

原文链接：https://zh-v2.d2l.ai/

版权

动手学深度学习+pytorch 专栏收录该内容

30 篇文章 3 订阅

订阅专栏

自定义块

自定义块必须提供基本的功能

1、将输入数据作为其正向传播函数的参数、

2、通过正向传播函数来生成输出。请注意，输出的形状可能与输入的形状不同

3、计算其输出关于输入的梯度，可通过其反向传播函数进行访问，通常这是自动发生的

4、存储和访问正向传播计算所需的参数

5、根据需要初始化模型参数

下面从零开始编写一个块，它包含一个多层感知机，其具有256个隐藏单元的隐藏层和一个10维输出层。

class MLP(nn.Module):
    # 用模型参数声明层。这里，我们声明两个全连接的层
    def __init__(self):
        # 调用`MLP`的父类`Block`的构造函数来执行必要的初始化。
        # 这样，在类实例化时也可以指定其他函数参数，例如模型参数`params`（稍后将介绍）
        super().__init__()
        self.hidden = nn.Linear(20, 256)  # 隐藏层
        self.out = nn.Linear(256, 10)  # 输出层

    # 定义模型的正向传播，即如何根据输入`X`返回所需的模型输出
    def forward(self, X):
        # 注意，这里我们使用ReLU的函数版本，其在nn.functional模块中定义。
        return self.out(F.relu(self.hidden(X)))

顺序块

class MySequential(nn.Module):
    def __init__(self, *args):
        super().__init__()
        for block in args:
            # 这里，`block`是`Module`子类的一个实例。我们把它保存在'Module'类的成员变量
            # `_modules` 中。`block`的类型是OrderedDict。
            self._modules[block] = block
            #for idx, module in enumerate(args):
            #    self.add_module(str(idx), module)

    def forward(self, X):
        # OrderedDict保证了按照成员添加的顺序遍历它们
        for block in self._modules.values():
            X = block(X)
        return X

在上述代码中之所以不用python的List，_modules的主要优点是，在块的参数初始化过程中，系统知道在_modules字典中查找需要初始化参数的子块

net = MySequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))
net(X)

例如，我们需要一个计算函数 $f(x,w) = c*w^{T}x$ 的层，其中，x是输入，w是我们的参数，c是常量

class FixedHiddenMLP(nn.Module):
    def __init__(self):
        super().__init__()
        # 不计算梯度的随机权重参数。因此其在训练期间保持不变。
        self.rand_weight = torch.rand((20, 20), requires_grad=False)
        self.linear = nn.Linear(20, 20)

    def forward(self, X):
        X = self.linear(X)
        # 使用创建的常量参数以及`relu`和`dot`函数。
        X = F.relu(torch.mm(X, self.rand_weight) + 1)
        # 复用全连接层。这相当于两个全连接层共享参数。
        X = self.linear(X)
        # 控制流
        while X.abs().sum() > 1:
            X /= 2
        return X.sum()

net = FixedHiddenMLP()
net(X)

嵌套组合块

class NestMLP(nn.Module):
    def __init__(self):
        super().__init__()
        self.net = nn.Sequential(nn.Linear(20, 64), nn.ReLU(),
                                 nn.Linear(64, 32), nn.ReLU())
        self.linear = nn.Linear(32, 16)

    def forward(self, X):
        return self.linear(self.net(X))

chimera = nn.Sequential(NestMLP(), nn.Linear(16, 20), FixedHiddenMLP())
chimera(X)

菜小鸡同志要永远朝光明前进

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
自定义层和快

自定义块自定义块必须提供基本的功能 1、将输入数据作为其正向传播函数的参数、 2、通过正向传播函数来生成输出。请注意，输出的形状可能与输入的形状不同 3、计算其输出关于输入的梯度，可通过其反向传播函数进行访问，通常这是自动发生的 4、存储和访问正向传播计算所需的参数 5、根据需要初始化模型参数下面从零开始编写一个块，它包含一个多层感知机，其具有256个隐藏单元的隐藏层和一个...
复制链接

扫一扫

专栏目录