在服务器上指定GPU跑代码

一、准备工作

查看GPU状态和信息,找到空闲的GPU:

nvidia-smi 

二、指定单GPU

从图中 Processes 表格我们可以发现0、1、2号GPU均是可以利用的。于是我们可以在python文件中加入以下代码,表示使用0号GPU:

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0"  # 使用0号GPU

或者可以在命令行窗口处输入,表示使用1号GPU运行代码:

CUDA_VISIBLE_DEVICES=1 python your_model.py # 使用1号GPU运行代码

再或者使用 torch.cuda.set_device()函数指定gpu使用编号:

import torch
torch.cuda.set_device(2) # 使用2号GPU

三、指定多GPU

若此时所有GPU都是空闲的,那么最简单的做法是:

import torch
model = torch.nn.DataParallel(model) # 使用默认所有存在的GPU

而假如像上文所述只有0、1、2号显卡空闲,那么可以使用以下代码指定多个GPU:

注意:无论是指定单个GPU还是多个GPU,设定 os 的语句需要放在 import torch 语句之前,否则指定GPU的操作可能无法生效

import os
os.environ["CUDA_VISIBLE_DEVICES"] = ','.join(map(str, [0,1,2])) # 一般在程序开头设置

import torch
model = torch.nn.DataParallel(model) # 等价于os.environ["CUDA_VISIBLE_DEVICES"] = '0,1,2'

可以看到两者相比,后者其实就是限定了GPU范围。

或者直接使用更简便的方法:

import torch
torch.nn.DataParallel(model, device_ids=[0, 1, 2]) # 使用0、1、2号GPU

四、补充

为GPU设置随机种子

import torch

torch.cuda.manual_seed(seed)
torch.cuda.manual_seed_all(seed)

  • 9
    点赞
  • 75
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要获取服务器显卡信息,可以使用Java程序访问操作系统的API或者使用第三方库来获取。下面是一个使用JNA库获取显卡信息的示例代码: ```java import com.sun.jna.Library; import com.sun.jna.Native; import com.sun.jna.Structure; import com.sun.jna.ptr.IntByReference; import com.sun.jna.win32.StdCallLibrary; public class GPUInfo { public static void main(String[] args) { try { GPUInfo.GPU gpu = GPUInfo.getGPU(); System.out.println(gpu.toString()); } catch (Exception e) { e.printStackTrace(); } } public static GPU getGPU() throws Exception { GPU gpu = new GPU(); NVAPI.NvAPI_Initialize(); NvPhysicalGpuHandle gpuHandle = new NvPhysicalGpuHandle(); NVAPI.NvAPI_EnumPhysicalGPUs(gpuHandle); NV_DISPLAY_DRIVER_MEMORY_INFO memInfo = new NV_DISPLAY_DRIVER_MEMORY_INFO(); memInfo.version = NV_DISPLAY_DRIVER_MEMORY_INFO_VER; NVAPI.NvAPI_GPU_GetMemoryInfo(gpuHandle, memInfo); gpu.memoryTotal = memInfo.memorySize; gpu.memoryUsed = memInfo.memoryUsed; gpu.memoryFree = gpu.memoryTotal - gpu.memoryUsed; return gpu; } public static class GPU { public int memoryTotal; public int memoryUsed; public int memoryFree; @Override public String toString() { return "GPU{" + "memoryTotal=" + memoryTotal + ", memoryUsed=" + memoryUsed + ", memoryFree=" + memoryFree + '}'; } } public interface NVAPI extends Library { int NVAPI_MAX_PHYSICAL_GPUS = 64; int NVAPI_MAX_USAGES_PER_GPU = 34; int NVAPI_INTERFACE_VERSION = 0x0100E900; int NVAPI_GENERIC_STRING_MAX = 4096; int ERROR_SUCCESS = 0; int ERROR_INVALID_PARAMETER = -1; int ERROR_NOT_SUPPORTED = -2; int ERROR_NVIDIA_DEVICE_NOT_FOUND = -3; int ERROR_FUNCTION_NOT_FOUND = -4; int ERROR_NVIDIA_DRIVER_NOT_LOADED = -5; NVAPI INSTANCE = (NVAPI) Native.loadLibrary("nvapi64", NVAPI.class); int NvAPI_Initialize(); int NvAPI_EnumPhysicalGPUs(NvPhysicalGpuHandle[] gpuHandles); int NvAPI_GPU_GetMemoryInfo(NvPhysicalGpuHandle gpuHandle, NV_DISPLAY_DRIVER_MEMORY_INFO pMemoryInfo); } public interface NV_DISPLAY_DRIVER_MEMORY_INFO_VER { } public static class NvPhysicalGpuHandle extends Structure { public byte[] data = new byte[4]; } public static class NV_DISPLAY_DRIVER_MEMORY_INFO extends Structure { public int version; public int values[]; } } ``` 需要注意的是,这个代码只能在Windows系统上运行,并且需要安装NVIDIA显卡驱动程序。如果你的服务器使用的是其他操作系统或者其他显卡品牌,需要使用相应的API或者库来获取显卡信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值