白猫黑猫抓到老鼠就是好猫!
先致敬参考文档:两篇:如下:
一、Ubuntu 16.04 禁用 nouveau 安装 nvidia显卡驱动
1.安装之前先卸载已经存在的驱动版本:
sudo apt-get remove --purge nvidia*
2.需要禁用 nouveau,只有在禁用掉 nouveau 后才能顺利安装 NVIDIA 显卡驱动,禁用方法就是在 /etc/modprobe.d/blacklist-nouveau.conf 文件中添加一条禁用命令,首先需要打开该文件,通过以下命令打开:
sudo gedit /etc/modprobe.d/blacklist.conf
输入密码后在最后一行加上: blacklist nouveau 是将Ubuntu自带的显卡驱动加入黑名单
Ctrl +C保存后注意此时还需执行以下命令使禁用 nouveau 真正生效终端输入 : sudo update-initramfs -u
3.重启之后,这里要尤其注意,安装显卡驱动要先切换到文字界面,(按Ctrl+Alt+F1~F6).所以,启动电脑后,先进入文字界面。 然后,首先输入命令sudo service lightdm stop
关闭桌面服务现在可以安装驱动了,先进入家目录 cd ~ ,然后: sudo sh ./NVIDIA-Linux-x86_64-375.20.run,按照提示一步步来完成后,再次重启电脑。
安装完成之后输入以下指令进行验证: sudo nvidia-smi ,若列出了GPU的信息列表则表示驱动安装成功。如下图:
二、ubuntu16.04安装cuda9.0和GPU版tensorflow(详细)
安装时各个版本之间一定要匹配!可参考如下版本:
1.安装显卡驱动,去官网选择自己合适的显卡
我的电脑适配的显卡是NVIDIA-Linux-x86_64-384.130.run
下载完成后放在home目录下,接着打开终端运行
sudo service lightdm stop
(此时会进入关闭图形界面之后黑屏,此时使用“ctrl+alt+F1”进入命令行界面)
在命令行输入
chmod 666 NVIDIA-Linux-x86_64-384.130.run
sudo ./ NVIDIA-Linux-x86_64-384.130.run
(接着会有一系列选项确定安装)
sudo service lightdm start
(返回图形界面)
然后在此处进行修改,选择应用更改选项。
输入nvidia-smi,测试显卡是否安装成功,如果出现这样的结果即表示安装成功了。
2.安装cuda
sudo sh cuda_9.0.176_384.81_linux.run
安装提示接着会有一系列选项,在是否安装Linux-x86_64 361.62驱动,这里必须输入“N”不安装否则, cuda后面的安装都会出错。后面的全部按照默认即可,安装完毕后,再声明一下环境变量,并将其写入到 ~/.bashrc 的尾部,终端输入:
echo 'export PATH=/usr/local/cuda-9.0/bin:$PATH' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
sudo reboot
重启后 运行
终端输入 nvcc -V后出现:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:03_CDT_2017
Cuda compilation tools, release 9.0, V9.0.176
说明cuda安装成功。
最后测试cuda9.0,在终端执行以下命令:
cd ~/NVIDIA_CUDA-9.0_Samples/1_Utilities/deviceQuery
make
./deviceQuery
输出Result = PASS 表示安装成功。
此处与两篇作者不同的地方:因为我需要的TensorFlow版本和python版本很确定。python3.6和tensorflow1.11,所以要先安装python,然后再基于python版本安装相应的TensorFlow和keras等。ubuntu系统自带python是python2.7和python3.5。因此需要更换。
三、Ubuntu安装Python3.6并切换到3.6版本
# 先update一下
sudo apt-get update
sudo apt-get install software-properties-common python-software-properties -y
# 这一句update好像不是必要的。
sudo apt-get update
sudo add-apt-repository ppa:jonathonf/python-3.6 -y
#这里必须update,不然无法安装python3.6
sudo apt-get update
sudo apt-get install python3.6 -y
#没有curl的话,就install一下
sudo apt-get install curl -y
# 安装pip
curl https://bootstrap.pypa.io/get-pip.py | sudo -H python3.6
下载对应的pip如下执行指令,
sudo apt-get install python-pip
sudo apt-get install python3-pip
之后可以到/usr/bin目录下面看pip,一般安装之后有pip,pip2,pip3,一般默认的pip是执行python2的,当然你可以自行修改这些,通过软连接
四、Ubuntu18.04系统查看已安装的 python 版本,及 Python2 与 Python3 之间切换
这个讲了如何切换。
3.安装tensorflow-gpu_1.8.0
(安装完测试,即可知道需要哪一个版本的cudnn)
pip install tensorflow-gpu==1.8.0
完成后输入
python
import tensorflow as tf
报错提示安装缺少libcudnn.so.7,即意味着需要安装cudnn版本为cudnn7.0
4.安装cudnn
https://developer.nvidia.com/rdp/cudnn-archive
需要注册和登录
选择点开
Download cuDNN v7.0.5 (Dec 5, 2017), for CUDA 9.0
点开
cuDNN v7.0.5 Library for Linux
下载 得到
cudnn-9.0-linux-x64-v7.tgz
然后在终端运行
$ tar -zxvf cudnn-9.0-linux-x64-v7.tgz
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
$ sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
接着,重新在终端运行
查看cudnn版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
或者
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
————————————————
然后开始安装
解压 cuDNN 代码
tar -xzvf cudnn-x.x-linux-x64-v8.x.x.x.tgz
将文件复制到 CUDA 路径下(这个路径我并没有直接设置为cuda,好像是默认的cuda-xx.x这样一个文件名,请按自己实际情况自行修改)
sudo cp cuda/include/cudnn*.h /usr/local/cuda-xx.x/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-xx.x/lib64
sudo chmod a+r /usr/local/cuda-xx.x/include/cudnn*.h /usr/local/cuda-xx.x/lib64/libcudnn*
cd到三个包的下载目录下,然后按照顺序运行:
安装 runtime library:
sudo dpkg -i libcudnn8_x.x.x-1+cudax.x_amd64.deb
安装developer library:
sudo dpkg -i libcudnn8-dev_8.x.x.x-1+cudax.x_amd64.deb
安装 code samples 和 cuDNN library documentation:
sudo dpkg -i libcudnn8-doc_8.x.x.x-1+cudax.x_amd64.deb
使用例子测试是否安装成功
复制 cuDNN sample到有读写权限的文件夹下:
$ cp -r /usr/src/cudnn_samples_v8/ $HOME
cd到复制的mnistcudnn目录下
$ cd $HOME/cudnn_samples_v8/mnistCUDNN
编译mnistCUDNN sample.
$make clean && make
运行mnistCUDNN sample.
$ ./mnistCUDNN
一番运行后,出现如下信息表明安装成功:
Test passed!
参考链接:
https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#cross-compiling-cudnn-overview
https://zhuanlan.zhihu.com/p/68544360
————————————————
版权声明:本文为CSDN博主「chch2010523」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/chch2010523/article/details/107929168
版权声明:本文为CSDN博主「知乎商业小管家」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_30069911/article/details/112834113
5.再次进行测试
输入
python
import tensorflow as tf
即可看到tensorflow1.8安装成功!
或者有一种简单的方法,直接在显卡驱动安装好之后,从官网下载anaconda3,因为清华和中科大最近宣布不再提供镜像源,>>>python
可看出python3由annaconda3调用。
>>>conda install tensorflow-gpu==1.8.0会自动在conda环境下安装tensorflow所需要的cuda以及cudnn,比较简单。
2021-4-27
在安装cudatoolkit之后再进行安装tensorflow就成功。
四、测试
1.测试代码
import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))
print(tf.test.is_gpu_available())
print(tf.__version__)
————————————————
版权声明:本文为CSDN博主「黄小黄i」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_43218120/article/details/108447605
CUDA】更改cuda版本后nvcc -V依然显示更改前的版本解决办法
Vincent__Lai 2019-10-01 16:22:08 10369 收藏 15
分类专栏: Python CUDA 深度学习
版权
问题描述
电脑有两个版本的cuda,一个是cuda-8.0,一个是cuda-9.0,若原版本是cuda-8.0,nvcc -V后会显示:
nvcc: NVIDIA ® Cuda compiler driver
Copyright © 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61
更换cuda的方法很简单,就是修改/usr/local/下cuda的link就好了,代码如下:
sudo ln -s /usr/local/cuda-9.0/ /usr/local/cuda
这个时候nvcc -V应该是会显示cuda-9.0,但是问题出现了,依然显示cuda-8.0
解决办法
原因是在于~/.bashrc文件中设置了环境变量,在终端输入sudo gedit ~/.bashrc,会看到下面这两行:
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
因此无论你怎么修改cuda的link,都会导向cuda-8.0。解决办法也很简单,把上面两行中的cuda-8.0改为cuda就好了,例如:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
然后保存文件退出,然后source ~/.bashrc
————————————————
版权声明:本文为CSDN博主「Vincent__Lai」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_38705903/article/details/101850116
gcc,g++均降级4.8
版本不匹配,再多查询一次,例如直接搜索“cuda10.0安装tensorflow"
tensorflow官方版本的支持:
确定安装1.13.1的版本
pip install tensorflow-gpu==1.13.1