os.environ['CUDA_VISIBLE_DEVICES'] = '2'
这段代码用于设置环境变量 CUDA_VISIBLE_DEVICES
,以指定在当前程序中可见的CUDA设备。具体来说,这段代码将CUDA设备的可见性限制为设备索引为 2
的GPU。
此环境变量指的是python运行中的环境变量,每次更新
详细解释
-
CUDA_VISIBLE_DEVICES:
CUDA_VISIBLE_DEVICES
是一个环境变量,用于控制在多GPU系统中哪些GPU设备对CUDA程序可见。- 通过设置这个变量,你可以屏蔽某些GPU,使它们对当前的CUDA程序不可见,从而只使用指定的GPU。
-
设备索引:
- CUDA设备的索引是从
0
开始的整数,依次代表系统中的每个GPU。例如,索引0
代表第一个GPU,索引1
代表第二个GPU,依此类推。 os.environ['CUDA_VISIBLE_DEVICES'] = '2'
表示程序只可以看到并使用第三个GPU(索引为2
)。
- CUDA设备的索引是从
-
示例:
- 假设系统中有四个GPU(索引从
0
到3
),如果设置os.environ['CUDA_VISIBLE_DEVICES'] = '2'
,那么程序中调用torch.cuda.device_count()
会返回1
,并且只有一个设备可用,即索引为0
的设备对应实际硬件的第三个GPU。
- 假设系统中有四个GPU(索引从
代码示例
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '2'
import torch
# 检查当前可用的CUDA设备数量
print(torch.cuda.device_count()) # 应输出 1
# 检查当前可见设备的索引
print(torch.cuda.current_device()) # 应输出 0
# 检查当前可用设备的名称
print(torch.cuda.get_device_name(0)) # 应输出设备索引为2的GPU名称
应用场景
-
资源隔离:
- 在多用户系统中,管理员可以使用该变量分配特定GPU给不同用户,以避免资源争夺。
-
调试和测试:
- 开发者可以通过该变量指定使用某个GPU进行调试或测试,而不影响其他GPU上的任务。
-
性能优化:
- 在某些情况下,指定使用某个GPU可以帮助优化性能,特别是在多个程序同时运行时,可以通过指定不同的GPU来避免负载过重。
通过合理设置 CUDA_VISIBLE_DEVICES
,可以更好地管理和利用多GPU系统中的计算资源。