对于GPU机器无法使用GPU,可能有以下原因:
1、没有相应的cuda环境,即cuda和cudnn
2、有安装cuda但是没有添加到系统环境变量,添加环境变量即可,例如linux下以cuda10.1为例
export PATH=$PATH:/usr/local/cuda-10.1/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.1/lib64
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda-10.1/lib64
3、没有安装GPU版本的框架,例如tensorflow-gpu
例如使用pip install tensorflow=2.0之后安装可能只是CPU版本的tensorflow,执行查看是否能调用gpu
import tensorflow as tf
print(tf.test.is_gpu_available())
执行后,结果返回结果是false。此时执行
pip install tensorflow-gpu=2.0
可以发现版本升级为gpu的:
The following packages will be DOWNGRADED:
_tflow_select 2.3.0-mkl --> 2.1.0-gpu
tensorflow 2.0.0-mkl_py36hef7ec59_0 --> 2.0.0-gpu_py36h6b29c10_0
tensorflow-base 2.0.0-mkl_py36h9204916_0 --> 2.0.0-gpu_py36h0ec5d1f_0