在使用 --nproc_per_node
参数时,如果有四个 GPU,但不想使用 GPU 1,可以使用 CUDA_VISIBLE_DEVICES
环境变量来限制可见的 GPU。
CUDA_VISIBLE_DEVICES=0,2,3 python training.py --nproc_per_node=3
在这个例子中,CUDA_VISIBLE_DEVICES
设置了可见的 GPU,排除了 GPU 1。然后,--nproc_per_node=3
指定了每个节点(即每台机器)上使用的 GPU 数量。这样就可以指定gpu训练了