Pytorch在输入和模型参数不变时，每次的输出会变化

一叶知秋境

已于 2023-02-02 23:38:46 修改

阅读量1.7k

点赞数 2

分类专栏：个人经验向文章标签： python 深度学习神经网络 pytorch

于 2021-04-26 22:34:12 首次发布

本文链接：https://blog.csdn.net/weixin_42572656/article/details/116175912

版权

个人经验向专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1. 问题

其实标题不大对，因为模型参数发生了改变，只是不知道。

1.1 首先其他人给出的答案在于BN层的问题，可以通过设置model.eval()解决，但这不是这个的问题。

1.2 这个的问题出在了模型的参数上，因为使用了多GPU训练的torch.nn.DataParallel(model)，导致在保存训练好的模型参数时，附带上了module，如下：

Missing key(s) in state_dict: "base.conv1.weight", "base.bn1.weight", "base.bn1.bias", "base.bn1.running_mean", "base.bn1.running_var", "base.layer1.0.conv1.weight", "base.layer1.0.bn1.weight", "base.layer1.0.bn1.bias", "base.layer1.0.bn1.running_mean", 
......
Unexpected key(s) in state_dict: "module.base.conv1.weight", "module.base.bn1.weight", "module.base.bn1.bias", "module.base.bn1.running_mean", "module.base.bn1.running_var", "module.base.bn1.num_batches_tracked", "module.base.layer1.0.conv1.weight", 
......

如此使得在测试模型时，导入参数的时候会有问题。

1.3 有时候问题不报错，是因为如下代码：

model.load_state_dict(state_dict, strict=False)

其中的参数strict=False就是保证即便导入的参数和模型不匹配，也会导入可以导入的参数。由此导致当你认为模型的输入和模型的参数不变，而模型的输出却在每次运行的结果都不一样。故可以设置为True或者不设置，就会严格执行对比，并且报错。

2. 解决方法

使用如下代码，改变导入参数的名称，去掉module：

ckpt = torch.load(model_path, map_location=map_location)['state_dicts'][0]
# 去除因DataParallel引起的参数module问题
from collections import OrderedDict
new_state_dict = OrderedDict()
for k, v in ckpt.items():
    name = k[7:]
    new_state_dict[name] = v
model.load_state_dict(new_state_dict)

一叶知秋境

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Pytorch在输入和模型参数不变时，每次的输出会变化

1. 问题其实标题不大对，因为模型参数发生了改变，只是你不知道。1.1 首先其他人给出的答案在于BN层的问题，可以通过设置model.eval()解决，但这不是我的问题。1.2 我的问题出在了模型的参数上，因为使用了多GPU训练的torch.nn.DataParallel(model)，导致在保存训练好的模型参数时，附带上了module，如下：Missing key(s) in state_dict: "base.conv1.weight", "base.bn1.weight", "base.b
复制链接

扫一扫