细节见上一篇博客深度环境配置
有些小的改进,不是很多
1.卸载cuda并安装
针对.run文件的卸载
cd /usr/local/cuda-8.0/bin
sudo ./uninstall_cuda-8.0/pl
cd ..
sudo rm -rf cuda-6.5/
安装
sudo chmod +x cuda_8.0.44_linux.run
sudo sh cuda_8.0.44_linux.run (驱动选no)
2修改环境变量
只要修改用户环境即可改为9.0并使其生效
source /etc/profile
sudo ldconfig
3测试
测试下是否安装成功了
nvcc -V
如果能检测出cuda,那么继续
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make all
sudo ./deviceQuery
4 安装cudnn
tar -zxvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp -a cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
注意上面第二条指令,这里多加了一个-a,在官方给的方案里面没有,我建议你这样做,否则会出现连接出错的问题。如果你忘记了,可以参考下面做法,这个可以取代软连接,好像挺方便的.
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.7.0
sudo ln -s libcudnn.so.7.0.64 libcudnn.so.7.0
sudo ln -s libcudnn.so.7.0 libcudnn.so
5安装tensorflow
pip install --ignore-installed https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.5.0-cp35-cp35m-linux_x86_64.whl
问题
终端可以import,pycharm import报错
OSError: libcudnn.so.7.0: cannot open shared object file: No such file or directory错误
解决:
sudo ldconfig /usr/local/cuda/lib64
6升级tensorflow至1.7
pip3 install --upgrade tensorflow-gpu==1.7.0rc1
因为电脑里面tensorflow版本比较多,检测下
#检测tf版本
import tensorflow as tf
tf.__version__
#检测tf是GPU还是CPU
import numpy
import tensorflow as tf
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
print(sess.run(c))
#看一下返回信息是GPU还是CPU