Pytorch：测试保存训练模型时，显存充足，却提示cuda out of memory的问题

最新推荐文章于 2024-03-01 14:15:31 发布

幽贺

最新推荐文章于 2024-03-01 14:15:31 发布

阅读量2.8k

点赞数 1

分类专栏：日常记录文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/qq_45656271/article/details/124987527

版权

日常记录专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在训练网络结束后，测试训练模型，明明显存还很充足，却提示我cuda out of memory

出现这种问题，有可能是指定GPU时出错（注意指定空闲的GPU），在排除这种情况以后，通过网上查找，说有可能是测试时的环境与训练时的环境不一样所导致，例如在网络训练时所使用的pytorch版本和测试时所使用的版本不同。由于我训练和测试用的同一虚拟环境，故排除这种情况。

还有一种说法，是因为pytorch的版本和cuda的版本不匹配所导致，经检查，也不是这方面的问题。

最后发现，在加载模型的时候，原代码为

# Initialize the network
generator = network.Name(opt)
# Load a pre-trained network
pretrained_net = torch.load(opt.load_name)
load_dict(generator, pretrained_net)

使用torch.load()时，应添加map_location，将其转移到CPU上，如下

# Initialize the network
generator = network.Name(opt)
# Load a pre-trained network
device = torch.device("cpu")
pretrained_net = torch.load(opt.load_name, map_location=device)
load_dict(generator, pretrained_net)

就可以解决了

幽贺

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
Pytorch：测试保存训练模型时，显存充足，却提示cuda out of memory的问题

在训练网络结束后，测试训练模型，明明显存还很充足，却提示我cuda out of memory出现这种问题，有可能是指定GPU时出错（注意指定空闲的GPU），在排除这种情况以后，通过网上查找，说有可能是测试时的环境与训练时的环境不一样所导致，例如在网络训练时所使用的pytorch版本和测试时所使用的版本不同。由于我训练和测试用的同一虚拟环境，故排除这种情况。还有一种说法，是因为pytorch的版本和cuda的版本不匹配所导致，经检查，也不是这方面的问题。最后发现，在加载模型的时候，原代码为
复制链接

扫一扫