使用pytorch时遇到的问题汇总(二)

最新推荐文章于 2024-04-16 00:15:47 发布

绛洞花主敏明

最新推荐文章于 2024-04-16 00:15:47 发布

阅读量1.1k

点赞数 1

分类专栏： Pytorch框架

本文链接：https://blog.csdn.net/qq_39852676/article/details/105608210

版权

Pytorch框架专栏收录该内容

30 篇文章 5 订阅

订阅专栏

1、Missing key(s) in state_dict: “cnn.cnn.0.weight”, “cnn.cnn.0.bias”, “cnn.cnn.3.weight”,… Unexpected key(s) in state_dict: “decoder.embedding.weight”…

情况分为两种
情况一

解决：model.load_state_dict(checkpoint, False)

这个部分的作用是判断上面参数拷贝过程中是否有unexpected_keys或者missing_keys,如果有就报错，代码不能继续执行。当然，如果strict=False，则会忽略这些细节。

情况二
原本的模型加载中如下图
在这里插入图片描述
在使用预训练模型时，pytorch的机制会导致模型每层前面加了一个模型名字：
如下的模型多了一个basemodel的字样

解决：

   for k, v in pretrained_dict.items():
        print("pretrained k,v:",k,v)
        if not k.find("basemodel") == -1: #if find pretrain model name, delete it
            name = k[(len("basemodel")+1):]   # remove `module.`
            model_dict[name] = v
        else:
            name = k
            print("delete last layer without pretrained model name")
        print("new_name:",name)