Pytorch学习（二）Pytorch对声明的网络结构进行初始化及‘ConvBlockInit‘ object has no attribute ‘weight‘错误出现原因分析

最新推荐文章于 2024-03-26 10:43:33 发布

TEn%

最新推荐文章于 2024-03-26 10:43:33 发布

阅读量4.2k

点赞数 8

分类专栏： Pytorch系列学习深度学习与神经网络文章标签：神经网络 pytorch

本文链接：https://blog.csdn.net/qq_37297763/article/details/116430049

版权

深度学习与神经网络同时被 2 个专栏收录

21 篇文章 5 订阅

订阅专栏

Pytorch系列学习

18 篇文章 24 订阅

订阅专栏

本文探讨了如何避免PyTorch中网络初始化时的错误，并介绍了两种改进方法：一是先定义网络再手动初始化权重，二是直接在网络结构中初始化。重点讲解了如何根据网络结构类型正确初始化Conv2d和BatchNorm2d的权重，以提升网络收敛效率。

摘要由CSDN通过智能技术生成

通常使用pytorch在一个类的__init__()函数中声明完网络结构后，pytorch会自动初始化待训练的网络结构的权值。但这种初始化过程是随机的，参数分布没有规律且相差较大，使得网络收敛速度下降。因此，我们手动初始化权重，可以采用服从正态分布的数据来初始化权重。

1. 方法一：先定义网络，后初始化权重

def weights_init_normal(m):     # 初始化权重
    classname = m.__class__.__name__
    if classname.find("Conv") != -1:
        torch.nn.init.normal_(m.weight.data, 0.0, 0.02)
    elif classname.find("BatchNorm2d") != -1:
        torch.nn.init.normal_(m.weight.data, 1.0, 0.02)
        torch.nn.init.constant_(m.bias.data, 0.0)

class ConvBlockInit(nn.Module):    # 定义网络结构
    def __init__(self, in_channels, out_channels):
        super(ConvBlockInit, self).__init__()
        self.init_conv = nn.Sequential(OrderedDict([
            ("conv0", nn.Conv2d(in_channels, out_channels, kernel_size=7, stride=1, padding=3, bias=False)),
            ("batchnorm0", nn.BatchNorm2d(out_channels)),
            ("relu0", nn.ReLU(inplace=True))
        ]))

    def forward(self, x):
        return self.init_conv(x)

net = ConvBlockInit(64, 256) 
net.apply(weight_init)  # 加载权重

'''
报错如下：
torch.nn.modules.module.ModuleAttributeError: 'ConvBlockInit' object has no attribute 'weight'
'''

上述初始化网络权重的方法会产生错误torch.nn.modules.module.ModuleAttributeError: ‘ConvBlockInit’ object has no attribute ‘weight’。
报错原因： apply()函数会递归的对该网络结构的所有children结构应用权重初始化条件，同时也对该网络结构应用初始化参数，然而ConvBlockInit不具有weight这个属性，所以报错。
我也把ConvBlockInit对应的m.class.__name__输出了一下，如下：
在这里插入图片描述
所以，不推荐上述方法，可以参照下边的参数初始化方法。

def weights_init_normal(m):     # 初始化权重
     if isinstance(m, nn.Conv2d):
         torch.nn.init.normal_(m.weight.data, 0.0, 0.02)
     elif isinstance(m, (nn.BatchNorm2d, nn.GroupNorm)):
         torch.nn.init.normal_(m.weight.data, 1.0, 0.02)
         torch.nn.init.constant_(m.bias.data, 0.0)

2. 方法二：在声明网络结构时，就初始化权重

class ConvBlockInit(nn.Module):    # 定义网络结构
    def __init__(self, in_channels, out_channels):
        super(ConvBlockInit, self).__init__()
        self.init_conv = nn.Sequential(OrderedDict([
            ("conv0", nn.Conv2d(in_channels, out_channels, kernel_size=7, stride=1, padding=3, bias=False)),
            ("batchnorm0", nn.BatchNorm2d(out_channels)),
            ("relu0", nn.ReLU(inplace=True))
        ]))
	    for m in self.modules():
			if isinstance(m, nn.Conv2d):
				torch.nn.init.normal_(m.weight.data, 0.0, 0.02)
			elif isinstance(m, (nn.BatchNorm2d, nn.GroupNorm)):
				torch.nn.init.normal_(m.weight.data, 1.0, 0.02)
				torch.nn.init.constant_(m.bias.data, 0.0)
    def forward(self, x):
        return self.init_conv(x)