费了老大的劲(直接装tensorflow-gpu,怎么都装不上;冥思苦想然后先装cuda10.1+cudnn7.5,可是怎么都装不成功;冥思苦想然后卸载已有显卡驱动,从头装,老是不成功;冥思苦想退出图形界面卸载安装,终于成了,tensorflow也终于可以装了,成功安装tensorflow后,测试无法正常使用),饶了好大的圈(安装tensorflow后,测试无法正常使用;千查万看然后卸载cuda10.1,输入:sudo /usr/local/cuda-10.1/bin/cuda-uninstaller注意:不需要卸载显卡驱动,不要给自己找麻烦;cudnn7.5不用卸载,虽然它是高版本,但安装cudnn7.4.1时依然会覆盖掉它即自动降级;然后安装cuda10.0但此时不按装driver,跟下文稍有不同,因下文是我避开坑的步骤),终于回来成功了,本文完成了一次壮举:用了cuda10.1中带的显卡驱动驱动的显卡,但其它确实用的cuda10.0的包括对应的cudnn。
切记1.不装cuda是装不上tensorflow-gpu版本的
2.不要用cuda10.1和cudnn7.5,因tensorflow不支持(官网有表格可查ttensorflow.google.cn/install/source)截至2019.4.24号只支持到cuda10.0和cudnn7.4.1,后来从新删除装好的cuda10.1,安装cuda10.0和cudnn7.4.1就能正常使用tensorflow了。
cuda10.0下载网址(大概2G): https://developer.nvidia.com/cuda-toolkit-archive
cudnn7.4.1.5下载网址(需要注册登陆才能看到并下载):https://developer.nvidia.com/rdp/cudnn-archive
点击:Download cuDNN v7.4.1 (Nov 8, 2018), for CUDA 10.0在下面的列表中下载如下两个两个文件:
cuDNN Runtime Library for Ubuntu16.04 (Deb)
cuDNN Developer Library for Ubuntu16.04 (Deb)
机器是计算机中心的人给配好的,他给我装好了2080Ti的驱动410的(其实这是cuda10.0自带的驱动版本),一开始我下载cuda10.1和cudnn7.5全部是最新的,老是装不上,打电话问英伟达的技术,说cuda10.1和cudnn7.5肯定支持2080Ti显卡,分析可能是原来的驱动没有删除或删除不彻底造成的,于是删驱动,可惜我原来没有退出图形界面,怎么删都还是装不了。成功步骤总结如下:
一、首先我们需要结束x-window的服务,否则驱动将无法正常安装,通过以下命令实现。
sudo service lightdm stop
在登陆界面状态下,按Ctrl + Alt + f1进入tty1即文字界面(如果想进入图形界面先输入: sudo service lightdm start,按回车键后,然后Ctrl+Alt+F7进入图形界面),先删除旧的驱动
先试试sudo /usr/bin/nvidia-uninstall
然后试试sudo apt-get purge nvidia*
然后重启
sudo reboot
输入以下命令检查安装成功与否:
nvidia-smi
如果安装不成功,则需要卸载重来 sh ./NVIDIA.run --uninstall(由于我安装成功了,所以这句没测过)
成功与否很明显,显卡驱动卸载后图形界面的图标会变得很大,且显示图片彩色文字等会很慢或无法显示,成功安装以后会变小分辨率明细变大当然图片等显示很流畅了。(tty1即文字界面,如果想进入图形界面先输入: sudo service lightdm start,按回车键后,然后Ctrl+Alt+F7进入图形界面)。
二、安装cuda
进入Downloads目录(cuda10.0和cudnn7.4.1通过浏览器下载时,都默认会保存着此文件夹,可打开看到下载好的文件)
cd Downloads
然后安装输入:sudo sh cuda*.run
然后用一本书的书角压住回车键,直到服务条款显示到100%。接着按下面的步骤选择:
accept
y(安装driver,如果已经有了驱动了,这步选N,我用10.1装过了驱动)
y
y
y
安装完成后,设置环境变量。
打开主目录下的 .bashrc文件并在末尾添加如下路径,例如我的.bashrc文件在/home下,如果没有找到,则按Ctrl+H键显示隐藏文件。
export LD_LIBRARY_PATH=
L
D
L
I
B
R
A
R
Y
P
A
T
H
:
/
u
s
r
/
l
o
c
a
l
/
c
u
d
a
−
10.0
/
l
i
b
64
e
x
p
o
r
t
P
A
T
H
=
LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64 export PATH=
LDLIBRARYPATH:/usr/local/cuda−10.0/lib64exportPATH=PATH:/usr/local/cuda-10.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.0
终端运行:source ~/.bashrc
检查:nvcc --version,如果显示一些文字就说明安装成功了。
在Downloads目录中分别运行安装cudnn,输入如下;
sudo dpkg -i libcudnn7_7.4.1.5-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.4.1.5-1+cuda10.0_amd64.deb
三、安装tensorflow:
pip3 install tensorflow-gpu (默认安装最新的稳定版本,目前以后肯定都是1.13了,因其后都是tensorflow2.0了)
验证
在terminal中输入:
python3
然后输入程序验证:
import tensorflow as tf
hello = tf.constant(‘Hello, TensorFlow!’)
sess = tf.Session()
print(sess.run(hello))
如果安装成功,则会显示 Hello, TensorFlow!
四、安装opencv
sudo pip3 install opencv-python 安装最新的opencv开发包
sudo pip3 install opencv-contrib-python 安装最新的opencv扩展包
检查,python3指令后,输入:
import cv2
没有报错的话,就是OPENCV安装成功了。
备注:安装cuda10.1和10.0的不同:
10.0如前面所示,中间显示好多页废话要一直按着回车键好久才到后面的正题,但cuda10.1就没有这些了(一个accept就行了),会显示一页带×的box,代表选中,默认是全部选中的包括显卡驱动即driver,光标移动到 install回车开始安装。
让输入时,输入accept,然后很快就装好了。