最近在服务上安装tensorflow-gpu一直出现下面这个错误:
ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory
Failed to load the native TensorFlow runtime.
搞了半天,才发现是tensorflow-gpu和cuda版本不匹配。不同tensorflow-gpu版本对应着不同cuda和cuDNN版本。如何查看cuda和cuDNN版本?
比如:
CUDA 8.0→cuDNN v5.1 / CUDA 8.0→cuDNN v6.0 / CUDA 9.0→cuDNN v7.0.5
tensorflow 1.6/1.5和CUDA 9.0对应,1.4/1.3和CUDA 8.0对应
于是乎,指定tensorflow-gpu版本重新安装(注意:不用先卸载之前安装tf,可直接pip,因为它在安装时会自动检测已经安装好的tf,并自动把它卸载掉)。
pip install tensorflow-gpu==1.5
注:最好使用镜像比如清华镜像,速度差别不是一点点。
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package
安装好之后可以测试一下
import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
显示大段相关信息表示安装成功!