【Pytorch笔记】查看网络中某一层反向传播的梯度

print("auxi=",nn.Sequential(*list(self.auxi_network.children())))

结果如下:
在这里插入图片描述

打印梯度:

print("auxi=",nn.Sequential(*list(self.auxi_network.children()))[0][4][1].conv1.weight.grad)

在这里插入图片描述

注意:
  1. 直接打印self.auxi_network.children()是不会显示网络结构的。只有用上面所示的nn.Sequential封装之后才能支持对网络结构的展示。
  2. 关于网络的类型,既可以用常规的定义一个网络类并实现forward方法,也可以使用nn.Squential对nn.Conv2d、nn.ReLU、nn.Linear等函数进行封装得到,如:
    model = nn.Sequential(
    nn.Conv2d(1,20,5),
    nn.ReLU(),
    nn.Conv2d(20,64,5),
    nn.ReLU()
    )

    值得注意的是,nn.Squential里还可以放入任何继承自nn.Module的自定义类,只要它实现了forward方法。例子:
    self.featurizer = networks.Featurizer(input_shape, self.hparams)
    self.classifier = networks.Classifier(self.featurizer.n_outputs, num_classes, self.hparams[‘nonlinear_classifier’])
    其中Featurizer是:在这里插入图片描述
    它所返回的ResNet类是自己封装的:
class ResNet(torch.nn.Module):
    """ResNet with the softmax chopped off and the batchnorm frozen"""

    def __init__(self, input_shape, hparams):
        super(ResNet, self).__init__()
        if hparams['resnet18']:
            self.network = torchvision.models.resnet18(pretrained=True)
            self.n_outputs = 512
        else:
            self.network = torchvision.models.resnet50(pretrained=True)
            self.n_outputs = 2048

        nc = input_shape[0]
        if nc != 3:
            tmp = self.network.conv1.weight.data.clone()
            self.network.conv1 = nn.Conv2d(
                nc, 64, kernel_size=(7, 7),
                stride=(2, 2), padding=(3, 3), bias=False)
            for i in range(nc):
                self.network.conv1.weight.data[:,
                                               i, :, :] = tmp[:, i % 3, :, :]
        # save memory
        del self.network.fc
        self.network.fc = Identity()
        self.freeze_bn()
        self.hparams = hparams
        self.dropout = nn.Dropout(hparams['resnet_dropout'])

    def forward(self, x):
        """Encode x into a feature vector of size n_outputs."""
        return self.dropout(self.network(x))

    def train(self, mode=True):
        """
        Override the default train() to freeze the BN parameters
        """
        super().train(mode)
        self.freeze_bn()

    def freeze_bn(self):
        for m in self.network.modules():
            if isinstance(m, nn.BatchNorm2d):
                m.eval()

因为本质上来说,这种继承自nn.Module的自定义的类和pytorch的nn.Conv2d等类本质是一样的,都可以理解为是个Module,接受一个输入并产生一个输出。查看nn.Sequential的源码就可以知道它支持这两种东西的输入。
nn.Sequential源码:

def __init__(self, *args):
        super(Sequential, self).__init__()
        if len(args) == 1 and isinstance(args[0], OrderedDict):#接收nn.Conv2d、nn.Linear这类参数,因为他们本质是OrderedDict
            for key, module in args[0].items():
                self.add_module(key, module)
        else:#接收自定义网络类
            for idx, module in enumerate(args):
                self.add_module(str(idx), module)

关于nn.Conv2d、nn.Linear为什么是OrderedDict,可以参考这篇文章,在此不做展开。
3. 对每一层的访问方式。模型打印出来前面带标号的,如(0),可以直接用下标[0]访问。如果前面是带名字的,如(con1),则需要用属性名.conv1访问。

### 回答1: torch.gather函数是PyTorch的一个函数,用于在给定维度上按索引从输入张量提取元素并构建新的张量。 torch.gather函数的语法为:torch.gather(input, dim, index, out=None)。 参数说明: - input:输入张量,即需要从提取元素的张量。 - dim:要在哪个维度上进行提取操作。 - index:一个包含需要提取元素的索引的张量。 - out:一个可选的输出张量。 在torch.gather函数,我们会按照dim指定的维度,在input张量上进行提取操作。提取操作是根据index张量给定的索引值来进行的。最终会构建一个新的张量,其包含了根据索引从input张量提取出来的元素。 例如,如果input是一个2维张量,shape为(3,4),而index是一个1维张量,shape为(3,),则dim的取值范围为[0, 1]。如果dim=0,那么提取操作将沿着第一个维度进行,在每一列上按照index张量对应的值进行元素的提取。如果dim=1,那么提取操作将沿着第二个维度进行,在每一行上按照index张量对应的值进行元素的提取。 使用torch.gather函数可以灵活地根据给定的索引从输入张量提取出所需的元素,这对于实现一些特定需求的操作非常有用。例如,可以在处理图像分类任务时,根据预测的类别标签,从softmax输出概率提取出对应类别的概率,进而用于计算损失函数或者评估模型性能等。 ### 回答2: torch.gather函数是一个PyTorch的操作函数,用于在指定维度上根据索引获取原始张量的元素。这个函数的使用方式为: output = torch.gather(input, dim, index, out=None, sparse_grad=False) 其,input是原始的张量,dim是指定的维度,index是需要提取的元素的索引。函数会根据dim指定的维度,在input张量提取index指定的元素,并返回一个新的张量output。 例如,假设input是一个3x4的二维张量,index是一个2x3的二维张量,dim的取值为1,那么torch.gather函数会在input的第1个维度上根据index的元素索引,提取相应的元素。最终得到的output是一个2x3的张量。 torch.gather函数在很多机器学习任务非常有用。例如,在序列标注任务,我们可以使用torch.gather函数根据标签索引来选择对应的预测结果。在图像分类任务,我们可以根据类别索引使用torch.gather函数进行结果的选择。此外,在自然语言处理任务torch.gather函数也可以用来根据单词的索引来选择对应的词向量。 需要注意的是,所提取的元素的维度必须与index的维度一致,否则会引发异常。此外,dim的取值必须在0到input的维度之间,否则也会引发异常。如果不指定out参数,函数会返回一个新的张量作为输出,如果指定了out参数,则会把提取的结果保存到指定的张量。最后,如果sparse_grad为True,则会返回一个稀疏梯度,否则返回一个密集梯度。 总之,torch.gather函数提供了一种方便和高效地根据索引提取元素的方式,广泛应用于各种机器学习任务
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值