.升级Tensorflow 1.15 以及 cuda10,进行分布式训练 ,发现gpu 内存都只占用 145M,开始测试单个卡也是145M ,使用如下简单测试下gpu是否能调用
import tensorflow as tf
import os
os.environ['CUDA_VISIBLE_DEVICES'] = "1"
print(tf.test.is_gpu_available())
为false
cat /usr/local/cuda/version.txt 输出正常
配置下cuda 环境变量 vim ~/.bashrc
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source ~/.bashrc jupyter 中当前Terminal 测试 后为True ,但新开一个Terminal或在 ipython中 运行 仍为False
vim
/etc/profile
如上配置 再运行 ldconfig 后 Gpu 终于正常 调用