一直都OOM(爆显存)弄得有点心乱,现在想搞明白究竟model.to(‘cuda:0’) 时,被移动到显存的变量类型是些什么。
当在PyTorch中调用 model.to('cuda:0')
时,它会将模型的所有参数和缓存(buffers)转移到指定的GPU设备上。这里提到的“参数”通常指的是模型的权重,它们是 torch.nn.Parameter
类型,而“缓存”是指注册为持久状态的张量。这些元素通常是使用 PyTorch 的 torch.Tensor
类型。
对于模型中的 Python 列表(list
)和 NumPy 数组,这些结构不会被自动转移到 GPU 上。PyTorch 的 to()
方法仅适用于 PyTorch 张量和模块。如果你的模型中包含了 Python 原生类型的列表或者 NumPy 数组,它们将保留在 CPU 上的内存中。
如果你需要将这些数据结构中的数据用于 GPU 计算,你必须手动将它们转换为 PyTorch 张量,并使用 .to('cuda:0')
显式地移动到 GPU。例如:
import torch
import numpy as np
# 假设你有一个 NumPy 数组
numpy_array = np.array([...])
# 将 NumPy 数组转换为 PyTorch 张量
tensor = torch.from_numpy(numpy_array)
# 将张量移动到 GPU
tensor = tensor.to('cuda:0')
在这个例子中,tensor
现在位于 GPU 上,而 numpy_array
仍然在 CPU 的内存中。记住,当你完成 GPU 上的计算后,如果需要将数据从 GPU 再传回 CPU,你可以使用 tensor.to('cpu')
或者 tensor.cpu()
。