pytorch加载nn.DataParallel训练的模型出现的问题

最新推荐文章于 2023-05-08 11:04:56 发布

景唯acr

最新推荐文章于 2023-05-08 11:04:56 发布

阅读量4.8k

点赞数 22

分类专栏： pytorch 玩转代码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41735859/article/details/108610687

版权

pytorch 同时被 2 个专栏收录

13 篇文章 6 订阅

订阅专栏

13 篇文章 9 订阅

订阅专栏

nn.DataParallel分布式训练后，如果直接使用torch.save(model.state_dict(), model_out_path)保存模型，等到再加载模型，可以将需要加载模型的网络也弄成分布式训练。也就是说，你训练网络时，net = torch.nn.DataParallel(net)，测试模型时也用net = torch.nn.DataParallel(net)，再加载。
分布式训练时，最好使用torch.save(model.module.state_dict(), model_out_path)保存模型，这样等到需要测试网络时，加载模型时用model.load_state_dict(torch.load(PATH, map_location=device))直接加载模型。

如果1，2你都不满足。又没有弄成分布式，保存的模型时又时直接使用torch.save(model.state_dict(), model_out_path)，再去加载模型时，会报以下错误：

RuntimeError: Error(s) in loading state_dict for net
Missing key(s) in state_dict: “features_1.0.weight”,…
Unexpected key(s) in state_dict: “features_1.module.0.weight”,…

可以看到错误信息提示key中多了‘.module’，那么，只要把‘.module’移除即可：

# original saved file with DataParallel
state_dict = torch.load(model_path)
# create new OrderedDict that does not contain `module.`
from collections import OrderedDict
new_state_dict = OrderedDict()
for k, v in state_dict.items():
    name = k.replace('.module.','.') # remove `module.`
    new_state_dict[name] = v
# load params
net.load_state_dict(new_state_dict)

参考链接：
https://www.jianshu.com/p/e96a013ab5fd
https://blog.csdn.net/CV_YOU/article/details/86670188

关注

22
点赞
踩
29

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

景唯acr CSDN认证博客专家 CSDN认证企业博客

码龄7年

44: 原创

4万+: 周排名

155万+: 总排名

53万+: 访问

: 等级

4071: 积分

360: 粉丝

774: 获赞

563: 评论

3553: 收藏

私信

关注

热门文章

分类专栏

最新评论

YOLOv5检测界面-PyQt5实现
2301_81701060: 博主，这个怎么加外设摄像头
python实现不同电脑之间视频传输
m0_53079604: 您好，想问一下传输的是实时的视频吗
CUB-200-2011鸟类数据集的下载与使用pytorch加载
HS_zhangjiong: 这个数据集对应每张图像有文本描述信息吗？
YOLOv5检测界面-PyQt5实现
q_1703: Traceback (most recent call last): File "C:\Users\95217\YOLO\PyQt5-YOLOv5-yolov5_v6.1\train.py", line 35, in <module> import val # for end-of-epoch mAP File "C:\Users\95217\YOLO\PyQt5-YOLOv5-yolov5_v6.1\val.py", line 28, in <module> from utils.plots import plot_images, output_to_target, plot_study_txt ImportError: cannot import name 'plot_study_txt' from 'utils.plots' (C:\Users\95217\YOLO\PyQt5-YOLOv5-yolov5_v6.1\utils\plots.py) 博主，想问一下如果我想训练自己的数据集在train.py里面出现这个问题有什么解决办法吗？我
YOLOv5检测界面-PyQt5实现
m0_65586110: 我也是这样。解决了吗哥

大家在看

游泳馆押金管理+手牌管理+刷手牌开通方法 1652

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。