pth文件保存的模型参数对不同GPU环境不适应问题的解决方案研究

最新推荐文章于 2023-10-24 14:39:08 发布

xdhsCS_cv_ml

最新推荐文章于 2023-10-24 14:39:08 发布

阅读量472

点赞数

文章标签：深度学习计算机视觉大数据

本文链接：https://blog.csdn.net/xdhsCS_cv_ml/article/details/114403146

版权

对于更改已保存的model weights以适应不同GPU数目的运行环境的(非正式、简略)研究的记录

————————————brief——————————————
结论：可行

转换pth的代码思路简述

load weights of DataParallel(model) run in 2gpu
save weights of model in .pth file.
—— 实际上到这一步已经可以了。有了这个 pth 文件，基本就OK了。我是因为积重难返，只能再加上后面几步操作来更好地解决自己遇到的问题。
os.environ["CUDA_VISIBLE_DEVICES"] = "0" to change used gpu amount
create new DataParallel(model) run in 1gpu
save the weights of new DataParallel(model)

————————————Details——————————————
应用场景/研究价值/适用的情况
适用于使用模型参数时运行环境内的GPU数目与训练模型时不同，或者运行环境内GPU数目不能确定的情况。
举例
模型使用 DataParallel(model) 在4GPUs环境中运行，并在保存模型参数时保存了 DataParallel(model) 的参数（model.state_dict()），而非单纯model的参数（model.module.state_dict()）。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xdhsCS_cv_ml

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

pytorch保存模型pth_详解Pytorch中的网络构造，模型save和load，.pth权重文件解析

weixin_32529429的博客

12-24

3642

pytorch最后的权重文件是.pth格式的。经常遇到的问题：进行finutune时，改配置文件中的学习率，发现程序跑起来后竟然保持了以前的学习率，并没有使用新的学习率。原因：首先查看.pth文件中的内容，我们发现它其实是一个字典格式的文件：其中保存了optimizer和scheduler，所以再次加载此文件时会使用之前的学习率。我们只需要权重，也就是model部分，将其导出就可以了import...

pytorch调用不了多个gpu_使用Pytorch在多GPU下保存和加载训练模型参数遇到的问题...

weixin_26824299的博客

12-24

400

最近使用Pytorch在学习一个深度学习项目，在模型保存和加载过程中遇到了问题，最终通过在网卡查找资料得已解决，故以此记之，以备忘却。首先，是在使用多GPU进行模型训练的过程中，在保存模型参数时，应该使用类似如下代码进行保存：torch.save({'epoch':epoch,'state_dict':model.module.state_dict(),'optimizer':optimiz...

参与评论您还未登录，请先登录后发表或查看评论

【Pytorch】.pth权重文件解析

咖啡味儿的咖啡

04-01

1万+

pytorch最后的权重文件是.pth格式的。经常遇到的问题：进行finutune时，改配置文件中的学习率，发现程序跑起来后竟然保持了以前的学习率，并没有使用新的学习率。原因：首先查看.pth文件中的内容，我们发现它其实是一个字典格式的文件其中保存了optimizer和scheduler，所以再次加载此文件时会使用之前的学习率。我们只需要权重，也就是model部分，将...

Pytorch只加载部分参数权重 load (pth文件) & 加载模型不完全匹配&module.后缀问题

qq_43416160的博客

11-10

2033

Pytorch只加载部分参数权重 load (pth文件) & 加载模型不完全匹配&module.后缀问题&model.load_state_dict函数的使用

pytorch加载预训练模型与自己模型不匹配的解决方法

找不到服务器的博客

02-27

6940

pytorch中如果自己搭建网络并且加载别人的与训练模型的话，如果模型和参数不严格匹配，就可能会出问题，接下来记录一下我的解决方法。两个有序字典找不同模型的参数和pth文件的参数都是有序字典(OrderedDict)，把字典中的键转为列表就可以在for循环里迭代找不同了。 model = ResNet18(1) model_dict1 = torch.load('resnet18.pth') model_dict2 = model.state_dict() model_list1 = list(mode

解决RuntimeError: xxx.pth is a zip archive (did you mean to use torch.jit.load()?)

最新发布

m0_73811163的博客

10-24

303

原因：我的unet模型是在colab上跑的，colab上的torch环境配置版本较高，而我自己anaconda中的pytorch环境配置的torch版本只有1.2.0，因此当试图在旧版pytorch（

论文笔记：A Lip Sync Expert Is All You Need for Speech to Lip Generation In The Wild

m0_55034547的博客

11-16

2344

论文笔记：A Lip Sync Expert Is All You Need for Speech to Lip Generation In The Wild

解决pytorch多GPU训练保存的模型,在单GPU环境下加载出错问题

09-16

### 解决PyTorch多GPU训练保存的模型，在单GPU环境下加载出错的问题 #### 背景在实际工作中，我们经常会遇到这样的情况：在配备了多张GPU的工作站或服务器上训练深度学习模型，然后将训练好的模型迁移到只有单个...

PyTorch 多 GPU 训练保存模型权重 key 多了 ‘module.‘

Fly2Leo的专栏

01-06

7362

使用 PyTorch 的 distributed 工具执行多 GPU 训练保存模型后，权重的 key 多了 'module.'，再次加载 state_dict 会出现 ‘“Missing key(s)” 错误。

Python环境设置

eric_wyf的专栏

09-24

336

有时候我们正在修改或调试的程序会是一个库，为修改方便，我们可能不大希望把它放到 site-packages 下面，而是更愿意把它保留在原始的工程目录中，以方便 IDE 和版本控制工具进行管理。那么怎么能让 Python 运行环境找到这个库呢？原理上， Python 运行环境查找库文件时本质是对 sys.path 列表的遍历，如果我们想给运行环境注册新的类库进来，要么得用代码给 s...

pythonpath环境变量pth_使用pth文件添加Python环境变量方式

weixin_39530839的博客

12-02

257

有时，在用import导入项目文件夹里自己写的python文件时，常常说找不到该文件，这时可以将项目路径添加到PYTHONPATH下。暂时添加：import syssys.path.append(项目路径)这种方法只会存在内存里，一旦退出python就没有了一劳永逸：在D:/anaconda/env/pytorch/lib/site-packages/里新建txt，修改后缀为.pth，在其中加入你...

Pytorch加载模型不完全匹配 & 只加载部分参数权重 load (pth文件) & 从网络加载权重(URL)

hxxjxw的博客

08-07

1万+

加载模型不完全匹配 model.load_state_dict(torch.load(weight_path), strict=False) 当权重中的key和网络中匹配就加载，不匹配就跳过如果strict是True，那必须完全匹配，不然就报错但是注意，如果是像英文模型迁移到中文，改了class num的话，例如由26改为3600，这时模型不匹配用它是解决不了的，因为此时模型的key名字是对应的上的，只是权重的size不同看只加载部分参数权重如果发生上述情况的话，那就需要把加.

加载多GPU训练的.pth加载新网络使用出现错误如何处理的问题

P_rincedom的博客

09-03

451

多GPU训练加载到新网络出现错误

pytorch 状态字典:state_dict

wzg2016的博客

10-21

3万+

pytorch 中的 state_dict 是一个简单的python的字典对象,将每一层与它的对应参数建立映射关系.(如model的每一层的weights及偏置等等) (注意,只有那些参数可以训练的layer才会被保存到模型的state_dict中,如卷积层,线性层等等) 优化器对象Optimizer也有一个state_dict,它包含了优化器的状态以及被使用的超参数(如lr, momentu...

几种机器学习的模型文件总结

qq_41867900的博客

02-12

6229

1.ckpt 是Tensorflow模型文件的保存模式。会有四个文件。 1.1 meta文件 .meta文件保存的是图结构，meta文件是pb（protocol buffer）格式文件，包含变量、op、集合等。 1.2 ckpt文件 ckpt文件是二进制文件，保存了所有的weights、biases、gradients等变量。在tensorflow 0.11之前，保存在.ckpt文件中。0.11后...

pytorch 模型 .pt, .pth, .pkl的区别及模型保存方式

热门推荐

shuijinghua的博客

12-17

10万+

我们经常会看到后缀名为.pt, .pth, .pkl的pytorch模型文件，这几种模型文件在格式上有什么区别吗？其实它们并不是在格式上有区别，只是后缀不同而已（仅此而已），在用torch.save()函数保存模型文件时，各人有不同的喜好，有些人喜欢用.pt后缀，有些人喜欢用.pth或.pkl.用相同的torch.save（）语句保存出来的模型文件没有什么不同。在pytorch官方的文档/代码...

python保存模型与参数_Pytorch - 模型和参数的保存与恢复

weixin_39646706的博客

03-02

1312

模型训练后，需要保存到文件，以供测试和部署；或，继续之前的训练状态.1. Best Practices主要有两种模型序列化保存和加载恢复的方法.1.1 方法 M1 - 推荐只保存和加载恢复模型参数(model parameters)：import torch# 保存torch.save(the_model.state_dict(), PATH)# 恢复the_model = TheModelCla...

pytorch模型保存与加载：state_dict、load_state_dict

weixin_42187536的博客

03-31

7014

简而言之，pytorch保存模型时用的映射关系。 pytorch中的state_dict是一个简单的python字典对象，将每一层与之对应的参数建立映射关系。只有参数可训练的layer才会保存到模型的state_dict中，如卷积层、线性层。优化器optimizer也有一个state_dict，包含了优化器的状态以及被使用的超参数（lr、momentum、weight_decay） state_dict是定义了model或optimizer之后pytorch自动生成的，可直接调用。常用的保存sta

pytorch保存模型pth_pytorch 模型加载与保存

weixin_42584507的博客

01-30

1329

pytorch的模型和参数是分开的，可以分别保存或加载模型和参数。pytorch有两种模型保存方式：一、保存整个神经网络的的结构信息和模型参数信息，save的对象是网络net二、只保存神经网络的训练模型参数，save的对象是net.state_dict()对应两种保存模型的方式，pytorch也有两种加载模型的方式。对应第一种保存方式，加载模型时通过torch.load('.pth')直接初始化新...

从pth文件中读取模型参数

09-07

从.pth文件中读取模型参数可以通过以下步骤进行： 1. 导入需要的库和模块，如torch.nn、torchvision.models等。 2. 创建一个空的模型对象，该对象要与要加载的模型参数相同。 3. 使用torch.load()函数加载.pth文件，得到一个字典对象。注意，需要设置参数map_location=torch.device('cpu')以确保在没有GPU的情况下也能加载模型。 4. 从字典对象中提取出模型参数，一般是通过键值对的方式找到模型的'weights'或者'state_dict'。 5. 将提取到的模型参数加载到创建的空模型对象中，可以通过模型对象.load_state_dict()方法实现。 6. 使用加载后的模型进行相应的操作，如预测、特征提取等。下面是一个示例代码： ```python import torch import torchvision.models as models # 创建空的模型对象 model = models.resnet18() # 加载.pth文件 checkpoint = torch.load('model.pth', map_location=torch.device('cpu')) # 提取模型参数 state_dict = checkpoint['state_dict'] # 加载模型参数到模型对象 model.load_state_dict(state_dict) # 使用加载后的模型进行操作 outputs = model(inputs) ``` 以上是从.pth文件中读取模型参数的基本流程，根据具体情况可能需要进行进一步的修改和调整。