CUDA编程 -- 1服务器集群登录某一台服务器 & 指定若干GPU设备

版权声明:林微原创,转载请注明出处: https://blog.csdn.net/Canhui_WANG/article/details/80789972

1. 问题描述
假设我们连接上一个GPU集群,该集群中服务器内网IP及其相对应的Hostname的映射关系如下,
这里写图片描述

2. 选择登录某一台指定服务器
方法一:通过Hostname登录服务器的SSH命令:

ssh IPaddress 

举例:

ssh 192.168.0.10

这里写图片描述

方法二:通过Hostname登录服务器的SSH命令:

ssh Hostname 

举例:

ssh gpu10

这里写图片描述

3. 指定该台服务器上的若干GPU外接设备
通过nvidia-smi命令,获知集群中的任何一台服务器上同时挂载着多个GPU设备,信息如下,
这里写图片描述

方法一:在该服务器中指定一个GPU设备,命令如下,

export CUDA_VISIBLE_DEVICES = GPU_DEVICE_ID

举例:

export CUDA_VISIBLE_DEVICES = 0

方法二:在该服务器中指定多个GPU设备,命令如下,

export CUDA_VISIBLE_DEVICES = GPU_DEVICE_ID, GPU_DEVICE_ID_1, ..., GPU_DEVICE_ID_N-1

举例:

export CUDA_VISIBLE_DEVICES = 0, 1, 2, 3

参考文献
[1. SSH 服务器登录] https://baike.baidu.com/item/ssh/10407?fr=aladdin
[2.Export GPU设备号] https://blog.csdn.net/u013850277/article/details/53446418

展开阅读全文

没有更多推荐了,返回首页