pytorch load_state_dict不生效

有时候我们会发现,load一个保存好的模型dict到一个新的模型对象的时候,并没有加载dict里面的数据。

一个简单例子

比如下图中,模型TestM里面定义了一个参数D,如果我不加:.cuda(),那么下面的例子是可以成功加载的,也就是说,print出来的 LoadedOrigin是相等的。

但是,如果对参数D加了 .cuda(),那么,Loaded就和Init 是一样的,并不等于Origin

结论

模型参数定义不要加.cuda(),应该统一在外面调用model.cuda().

大家可以复制下面代码进行简单测试即可。

import torch
from torch import nn

class TestM(nn.Module):
    def __init__(self):
        super(TestM, self).__init__()
        self.D = nn.Parameter(torch.randn(2, 2).float())  # 成功
        # self.D = nn.Parameter(torch.randn(2, 2).float()).cuda() # 失败
        
    def forward(self, x):
        return x

tm1 = TestM()
print("Origin: ", tm1.D)
torch.save(tm.state_dict(), 'tm_test.pth')

tm2 = TestM()
print("Init: ", tm2.D)
tm2.load_state_dict(torch.load('tm_test.pth'))
print("Loaded: ", tm2.D)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值