本人在学习tensorflow途中遇到很多坑,很多一起学习的朋友也遇到相似的问题,鉴于此写下本文章以帮助大家解除疑惑,共同进步。
前提须知
(1)系统环境:原生Ubuntu18.0.4(什么东西都没装)
(2)目的:安装tensorflow-gpu 1.14 环境
一.修改安装源(提高效率)&&更新软件
1.修改下载服务器
(其实这一步不是很必要,只是为了用国内安装源下载快一点以节省时间,按个人需求使用。)
打开应用页,点“软件和更新”,在“Ubuntu软件”这一栏,点击“下载自”下拉框,点“其他”,选取中国的下载服务器,这里选阿里云的,其他的也可,然后点右下角的“关闭->重新载入”,更新下缓存就好了。如图:
2.更新软件
打开终端,输入下面代码进行软件更新
sudo apt-get update
输入你的管理员密码,等待更新完成
二.安装显卡驱动
在终端执行下面这行代码就行了,自动安装ubuntu官方支持的显卡驱动。
sudo ubuntu-drivers autoinstall
等待安装完成,重启一下电脑,然后输入下面指令查看驱动是否安装成功
nvidia -smi
成功标志即打印出你的显卡信息,如图
三.CUDA和CUDNN下载安装
1.CUDA
这里我们选的是CUDA 10.0版本
官方下载链接:
https://developer.nvidia.com/cuda-10.0-download-archive
按图选择下载相应的版本的cuda10.0文件,点Download按钮
等待下载完成后,在下载位置打开终端运行下面指令来安装cuda
sudo sh cuda_10.0.130_410.48_linux.run
出现让你阅读条款可以按Ctrl+C跳过
然后分别按一下输入,空行表示回车
accept
n
y
y
y
等待安装完成
安装完成截图
2.CUDNN
官方下载链接(这里需要注册登录才能下载):
https://developer.nvidia.com/cudnn
如图:
点Download CUDNN按钮
登录(没有就注册一个,也可以微信扫码登录)
下载CUDNN 7.6.5这个版本的(因为这个与我们安装的CUDA版本对应)
输入下面指令
sudo nautilus
会弹出文件管理器,然后到你刚才下载cudnn的位置(默认就在左边那一列的“下载”这个位置)
提取下载好的.tgz文件,打开解压出来的文件夹,会有一个“cuda”的文件夹,打开这个文件夹,选取"include"和"lib"这两个文件夹,右键->剪切,然后点左边那一列选“文件系统”,移到最下面找到"usr"这个文件夹并打开->
打开“local”文件夹->
打开"cuda-10.0"文件夹->
右键空白位置->粘贴->
弹出合并窗口,勾上“应用此操作到所有文件和文件夹”->点“合并”按钮
然后叉掉窗口
如图所示:
3.添加环境变量
回到终端,执行下面指令
sudo gedit ~/.bashrc
此时会打开一个文件,复制下面代码
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
回到打开的文件,滚到最下面,粘贴上复制的这些代码,然后按"Ctrl+S"保存,关闭。
执行下面指令,实现CUDA和CUDNN的连接
sudo cp /usr/local/cuda-10.0/lib64/libcudart.so.10.0 /usr/local/lib/libcudart.so.10.0 && sudo ldconfig
sudo cp /usr/local/cuda-10.0/lib64/libcublas.so.10.0 /usr/local/lib/libcublas.so.10.0 && sudo ldconfig
sudo cp /usr/local/cuda-10.0/lib64/libcurand.so.10.0 /usr/local/lib/libcurabd.so.10.0 && sudo ldconfig
sudo cp /usr/local/cuda-10.0/lib64/libcudnn.so.7 /usr/local/lib/libcudnn.so.7 && sudo ldconfig
sudo cp /usr/local/cuda-10.0/lib64/libcusolver.so.10.0 /usr/local/lib/libcusolver.so.10.0 && sudo ldconfig
sudo cp /usr/local/cuda-10.0/lib64/libcufft.so.10.0 /usr/local/lib/libcufft.so.10.0 && sudo ldconfig
四.安装Tensorflow
1.安装pip和pip3
在终端执行下面指令
sudo apt install python-pip python3-pip
2.安装Tensorflw-gpu版和Numpy(如果跟我同个课程学习的同学请直接看补充!!!)
执行下面两个指令
sudo pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==1.14.0 numpy==1.16.3
sudo pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==1.14.0 numpy==1.16.3
等待安装完成
在终端输入python3
,再输入import tensorflow as tf
导入tensorflow检测是否成功,成功截图如下
至此,你的tensorflow安装就算完成了,祝学习愉快!
--------------------补充--------------------
如有报错
AttributeError: module ‘tensorflow’ has no attribute 'python’
请按以下2个step操作
step1.卸载掉1.14版本的Tensorflow(如果你没安装过tensorflow请忽略这一step)
sudo pip uninstall tensorflow
step2.安装1.13.1版本的Tensorflow
sudo pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==1.13.1 numpy
sudo pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==1.13.1 numpy
报错是因为1.14版本的接口更新了,以上方法亲测有效。
--------------------补充完毕--------------------
如有遗漏或错误欢迎私信我改正,谢谢!