pytorch 状态字典:state_dict命名规则

摸个类中的名称就在def __init__(self)中定义,名字就是self中的定义名称,若在类中还是用了其他的类,那么名称则为实例化的变量名称.其他类中的命名规则

实验代码:

# encoding:utf-8

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import numpy as mp
import matplotlib.pyplot as plt
import torch.nn.functional as F


# define model
class test(nn.Module):
    def __init__(self):
        super(test, self).__init__()
        self.xxxx = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
class TheModelClass(nn.Module):
    def __init__(self):
        super(TheModelClass, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)
        self.test= test()

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x


def main():
    # Initialize model
    model = TheModelClass()

    # Initialize optimizer
    optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

    # print model's state_dict
    print('Model.state_dict:')
    for param_tensor in model.state_dict():
        # 打印 key value字典
        print(param_tensor, '\t', model.state_dict()[param_tensor].size())

    # print optimizer's state_dict
    print('Optimizer,s state_dict:')
    for var_name in optimizer.state_dict():
        print(var_name, '\t', optimizer.state_dict()[var_name])


if __name__ == '__main__':
    main()

Model.state_dict:
conv1.weight      torch.Size([6, 3, 5, 5])
conv1.bias      torch.Size([6])
conv2.weight      torch.Size([16, 6, 5, 5])
conv2.bias      torch.Size([16])
fc1.weight      torch.Size([120, 400])
fc1.bias      torch.Size([120])
fc2.weight      torch.Size([84, 120])
fc2.bias      torch.Size([84])
fc3.weight      torch.Size([10, 84])
fc3.bias      torch.Size([10])
test.xxxx.weight      torch.Size([6, 3, 5, 5])
test.xxxx.bias      torch.Size([6])
test.conv2.weight      torch.Size([16, 6, 5, 5])
test.conv2.bias      torch.Size([16])
Optimizer,s state_dict:
state      {}
param_groups      [{'lr': 0.001, 'momentum': 0.9, 'dampening': 0, 'weight_decay': 0, 'nesterov': False, 'params': [140443279400536, 140443279400680, 140443279400752, 140443279400824, 140443279400608, 140443279400896, 140443276828744, 140443276828816, 140443276828888, 140443276828960, 140443276829032, 140443276829104, 140443276829176, 140443276829248]}]

### 回答1: 函数。 PyTorch中的load_state_dict()函数可以把一个保存的模型参数加载到模型中。它可以把模型的参数从一个字典对象中加载到模型中,也可以把参数从一个保存的文件中加载到模型中。这个函数可以帮助用户从模型的训练中恢复,从而可以继续训练模型或者使用模型进行预测。 ### 回答2: pytorch的load_state_dict()函数是用于加载预训练模型参数的方法。它接收一个state_dict参数,state_dict是一个Python字典对象,包含了模型的参数和对应的权重。load_state_dict()方法将这些参数加载到指定的模型中。 PyTorch模型通过一个有序字典对象来存储所有的模型参数,包括模型的可训练和不可训练参数。state_dict中的key对应于模型的每个参数的名称,value则存储了相应参数的权重。 当我们进行模型训练,并在某个epoch达到最佳模型时,我们可以使用state_dict将这些训练好的参数保存下来。之后,当我们需要再次使用这个模型时,可以使用load_state_dict()加载这些保存下来的参数,以便于我们继续模型训练或进行预测。 使用load_state_dict()的基本步骤是: 1. 定义一个与要加载参数的模型相同的模型对象; 2. 调用load_state_dict()方法并传入保存下来的state_dict; 3. 通过调用加载参数的模型对象就可以使用保存下来的参数进行训练或者进行预测。 在加载参数时,需要注意参数的名称和结构应该与之前保存的参数保持一致,否则会导致参数加载失败。可以通过指定strict=False来允许一部分参数不存在。 除了加载整个模型的参数,还可以通过使用load_state_dict()来加载模型的部分参数,例如只加载某个层的参数。 总而言之,pytorch的load_state_dict()函数是一个用于加载预训练模型参数的重要工具,可以帮助我们在训练和预测中有效地管理和使用模型的权重。 ### 回答3: pytorch 中的 load_state_dict() 是一个模型加载函数,用于加载预训练模型的参数。它是一个模型类的方法,可以通过调用模型对象的 load_state_dict() 函数来使用。 load_state_dict() 函数需要传入一个参数,即预训练模型状态字典state_dict)。状态字典是一个 Python 字典,它将每个模型的参数名称映射到其对应的参数值。模型状态字典可以通过模型对象的 state_dict() 函数来获取。 当我们在 PyTorch 中训练一个模型时,优化器会保存模型的参数状态以及优化器的状态,方便下次恢复训练。load_state_dict() 函数将会加载预训练模型的参数状态字典到当前模型中,以便我们可以从预训练模型中复制参数值。 在调用 load_state_dict() 函数之前,我们需要确保预训练模型和当前模型的网络结构是一致的,即它们具有相同的模型参数名字和参数形状。如果预训练模型和当前模型的网络结构不一致,load_state_dict() 函数会抛出错误。 一般来说,加载预训练模型的过程分为两个步骤。首先,我们创建一个空的模型对象,并根据预训练模型的网络结构进行初始化。然后,我们调用 load_state_dict() 函数来加载预训练模型的参数。 总之,pytorch 中的 load_state_dict() 函数是一个方便的模型加载函数,它可以加载预训练模型的参数。我们可以使用它来快速加载训练好的模型,以便进行推理、迁移学习等任务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值