model.to(‘cuda:0‘) 时，被移动到显存的变量类型

重剑DS

于 2024-03-19 11:14:18 发布

阅读量362

点赞数 3

分类专栏：深度学习文章标签： GPU显存 OOM pytorch numpy

本文链接：https://blog.csdn.net/qq_45732909/article/details/136836433

版权

深度学习专栏收录该内容

37 篇文章 0 订阅

订阅专栏

一直都OOM（爆显存）弄得有点心乱，现在想搞明白究竟model.to(‘cuda:0’) 时，被移动到显存的变量类型是些什么。

当在PyTorch中调用 model.to('cuda:0') 时，它会将模型的所有参数和缓存（buffers）转移到指定的GPU设备上。这里提到的“参数”通常指的是模型的权重，它们是 torch.nn.Parameter 类型，而“缓存”是指注册为持久状态的张量。这些元素通常是使用 PyTorch 的 torch.Tensor 类型。

对于模型中的 Python 列表（list）和 NumPy 数组，这些结构不会被自动转移到 GPU 上。PyTorch 的 to() 方法仅适用于 PyTorch 张量和模块。如果你的模型中包含了 Python 原生类型的列表或者 NumPy 数组，它们将保留在 CPU 上的内存中。

如果你需要将这些数据结构中的数据用于 GPU 计算，你必须手动将它们转换为 PyTorch 张量，并使用 .to('cuda:0') 显式地移动到 GPU。例如：

import torch
import numpy as np

# 假设你有一个 NumPy 数组
numpy_array = np.array([...])

# 将 NumPy 数组转换为 PyTorch 张量
tensor = torch.from_numpy(numpy_array)

# 将张量移动到 GPU
tensor = tensor.to('cuda:0')

在这个例子中，tensor 现在位于 GPU 上，而 numpy_array 仍然在 CPU 的内存中。记住，当你完成 GPU 上的计算后，如果需要将数据从 GPU 再传回 CPU，你可以使用 tensor.to('cpu') 或者 tensor.cpu()。

重剑DS

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
model.to(‘cuda:0‘) 时，被移动到显存的变量类型

如果你的模型中包含了 Python 原生类型的列表或者 NumPy 数组，它们将保留在 CPU 上的内存中。时，它会将模型的所有参数和缓存（buffers）转移到指定的GPU设备上。这里提到的“参数”通常指的是模型的权重，它们是。仍然在 CPU 的内存中。记住，当你完成 GPU 上的计算后，如果需要将数据从 GPU 再传回 CPU，你可以使用。如果你需要将这些数据结构中的数据用于 GPU 计算，你必须手动将它们转换为 PyTorch 张量，并使用。类型，而“缓存”是指注册为持久状态的张量。
复制链接

扫一扫