pytorch模型参数名字

最新推荐文章于 2023-12-13 23:11:23 发布

_less is more

最新推荐文章于 2023-12-13 23:11:23 发布

阅读量221

点赞数

分类专栏： Deep Learning 文章标签： pytorch 人工智能 python

本文链接：https://blog.csdn.net/weixin_42815846/article/details/134875353

版权

Deep Learning 专栏收录该内容

19 篇文章 2 订阅

订阅专栏

如下是一个模型输出片段，来自magicAnimate，该模型称把unet网络换成了3D的，也可以看到如下的resent block命名也是ResnetBlock3D，里面的convolution也是InflatedConv3d

	(resnets): ModuleList(
      (0-1): 2 x ResnetBlock3D(
        (norm1): GroupNorm(32, 1280, eps=1e-05, affine=True)
        (conv1): InflatedConv3d(1280, 1280, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
        (time_emb_proj): Linear(in_features=1280, out_features=1280, bias=True)
        (norm2): GroupNorm(32, 1280, eps=1e-05, affine=True)
        (dropout): Dropout(p=0.0, inplace=False)
        (conv2): InflatedConv3d(1280, 1280, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
        (nonlinearity): SiLU()
      )
    )

不过其实magicAnimate的unet model参数没有被训练，是直接使用的stable diffusion 1.5版本的参数。所以问题来了，为什么3D的新模型可以使用SD1.5的2D的网络模型？

其实就是虽然magicAnimate的这些类叫3D，但其实背后都是用的2D的convolution，所以模型参数是可以一一对应上的，因此他们只需要把参数的命名设置成和SD1.5一样的即可，此时当使用load_state_dict来load模型参数的时候就可以直接使用上pretrained模型参数

这个pytorch命名方式有两种
1、当使用nn.Sequential或者nn.ModuleList的时候，如果不指定名字，则会默认使用0,1,2…，如下情况

model = nn.Sequential(
    nn.Conv2d(1, 20, 5),
    nn.ReLU(),
    nn.Conv2d(20, 64, 5),
    nn.ReLU()
)

如果指定了名字，则用指定的，比如

model = nn.Sequential(OrderedDict([
    ('conv1', nn.Conv2d(1, 20, 5)),
    ('relu1', nn.ReLU()),
    ('conv2', nn.Conv2d(20, 64, 5)),
    ('relu2', nn.ReLU())
]))

2、直接定义module，比如

self.conv1 = nn.Conv2d(1, 20, 5)
self.relu1 = nn.ReLU()
self.conv2 = nn.Conv2d(20, 64, 5)
self.relu2 = nn.ReLU()

这时候这个模块的名字则会使用python变量的名字，即conv1，relu1，conv2，relu2

_less is more

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch模型参数名字

如下是一个模型输出片段，来自magicAnimate，该模型称把unet网络换成了3D的，也可以看到如下的resent block命名也是ResnetBlock3D，里面的convolution也是InflatedConv3d。其实就是虽然magicAnimate的这些类叫3D，但其实背后都是用的2D的convolution，所以模型参数是可以一一对应上的，因此他们只需要把。这时候这个模块的名字则会使用python变量的名字，即conv1，relu1，conv2，relu2。
复制链接

扫一扫