Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!

最新推荐文章于 2024-05-27 14:36:39 发布

七白学长

最新推荐文章于 2024-05-27 14:36:39 发布

阅读量647

点赞数

分类专栏：错误汇总文章标签： python 深度学习机器学习

本文链接：https://blog.csdn.net/wangshuhuan1/article/details/126461911

版权

2 篇文章 0 订阅

订阅专栏

问题描述：

在加入中断训练代码之后，从中断处训练，出现了保存的模型和优化器权重不在同一设备下的错误。在网上搜索之后，找到了许多解决方法，但都不适合我，在这里做一下总结：

在模型载入时，用map_location指定使用设备

checkpoint = torch.load(log_dir,map_location={'cuda:0':'cpu'})
model.load_state_dict(checkpoint['model'])

使用torch.device去指定GPU设备

device = torch.device("cuda:{}".format(rank))

经过几轮修改，发现以上解决方法都不适合我的问题，依旧还是会报错。最后经过检查发现，是我在加载了保存模型的优化器参数之后又重新加载了一次，导致出现了问题。把第二次的注释掉之后就好了。
在这里插入图片描述

关注