1 安装显卡驱动
我的附加驱动中有nvidia,所以直接到软件和更新中去设置即可,如下图:
选中nvidia…384.130…这个驱动,然后点击apply changes,成功应用后重启电脑。
ps:384是cuda9要求的最低的驱动版本,如果考虑到以后需要安装高版本cuda,这里就应该安装更新的驱动,对应关系如下:参考这个博主的
重启之后,打开命令行输入nvidia-smi,可得到如下信息:
说明驱动已经安装成功(比网上的简单多了,最主要的是官网现在已经没有384.130的驱动版本了)
2 安装CUDA
2.1 安装
去官网(这里给出的是cuda9.0对应的网址,直接进入的官网是最新的cuda10.1),根据自己的系统(linux)下载对应安装包,此处应该下载的是runfile文件。
如下图,依次选择墨绿色的选项,最后得到下载文件,选择Download(这里我的驱动是384的,cuda版本也是cuda9.0…384…)
下载好文件以后,在包含该文件的目录下打开终端,输入一下命令:
sudo ./cuda_9.0.176_384.81_linux.run
按照提示进行安装,先是阅读协议,按 ctrl+c 可以直接跳过,然后接收协议,输入 accept,接下来会询问是否安装驱动,一定要选择n,否则会覆盖之前安装的驱动。
Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: n
Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit: y
Enter Toolkit Location
[ default is /usr/local/cuda-9.0 ]:
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit: y
安装完成如下图所示:
2.2 声明环境变量
执行一下命令打开~/.bashrc文件
gedit ~/.bashrc
在该文件最后添加以下内容:
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存推出,执行
source ~/.bashrc
2.3 测试安装是否成功
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
看到Result = PASS,则说明cuda安装成功
3 安装CUDNN7.1
去官网下载cudnn7.1,对应的文件是cudnn-9.0-linux-x64-v7.1.tgz,然后解压,进入文件目录,只需要将其中的几个文件拷贝到cuda中即可。安装了cudnn就可以对tesorflow进行加速。
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
之后到cuda本地路径创建软链接:
cd /usr/local/cuda/lib64
sudo chmod +r libcudnn.so.7.1.4
sudo ln -sf libcudnn.so.7.1.4 libcudnn.so.7
sudo ln -sf libcudnn.so.7 libcudnn.so
sudo ldconfig
然后输入
ll
出现下图,表明安装成功:
4 安装tensorflow-gpu
如果之前已经安装过,则需要先卸载再安装,根据你自己的需要,按照python2的或者python3的:
其次,cuda9.0和cudnn7对应的一个TensorFlow-gpu是1.8.0
python2
sudo pip uninstall tensorflow # for python2.7
sudo pip install tensorflow-gpu==1.8.0 # for python2.7
python3
sudo pip3 uninstall tensorflow # for python3
sudo pip3 install tensorflow-gpu==1.8.0 # for python3
安装后以后测试:
python
import tensorflow as tf
或者
python3
import tensorflow as tf
如果没有报错则说明安装成功。
安装的过程中,由于网络的问题,很有可能出现网络延时无法安装成功(出现很多行红色信息),此时采用如下命令,手动设置pip的延时
python2
sudo - H pip --default-timeout=100 install tensorflow-gpu==1.8.0 # for python2.7
python3
sudo -H pip3 --default-timeout=100 install tensorflow-gpu==1.8.0 # for python3