在使用gpu服务器训练tensorflow模型时,总是占满显存!
TensorFlow默认的是占用所有GPU
因此我们需要手动设置使用的GPU编号以及单个GPU显存占用比例
1.第一步需要在代码中开头加入
import os
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" # 按照PCI_BUS_ID顺序从0开始排列GPU设备
os.environ["CUDA_VISIBLE_DEVICES"]=‘0’ # 使用0号gpu(想使用其他编号GPU,对应修改引号中的内容即可)
os.environ["CUDA_VISIBLE_DEVICES"]=‘0,1’ # 使用0号GPU和1号GPU
2.第二步需要将代码中的sess = tf.Session()
改为
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.333) # 通过改变0.333可以改变占用显存比例
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))
per_process_gpu_memory_fraction=0.333
代表的含义就是每个GPU进程中使用显存的上限为该GPU总量的1/3
3.如果想要在程序运行过程中连续查看GPU信息
可以在终端使用该 指令(前提是设备中有合适的NVIDIA驱动)
(注:以上内容如有错误,请在评论区中指出,共同进步哈)