实验室服务器安装cuda9.0，cudnn，Anaconda，tensorflow-gpu（小白教程）

最新推荐文章于 2024-07-15 02:50:19 发布

azeyeazeye

最新推荐文章于 2024-07-15 02:50:19 发布

阅读量3.7k

点赞数 2

文章标签：服务器 tensorflow-gpu 服务器连接软件 cuda和cudnn anacanda3

本文链接：https://blog.csdn.net/azeyeazeye/article/details/90199915

版权

昨天的刚接触服务器，今天就可以跑模型了，还挺爽的。

系统：本地windows，服务器 Centos7 ，64位
安装包：MobaXterm，cuda9.0，cudnn，Anaconda（资源下载链接：https://pan.baidu.com/s/16YbybsV3jTjKDm48tcVg4A
提取码：ng64 ）

1.安装MobaXterm

（是自己电脑与服务器远程连接的可视化软件，操作简单），具体看安装使用教程（试了3种 MobaXterm ，Xshell ，WinSCP，最后发现MobaXterm好用）。 以下几步操作参考这篇博客【在服务器上安装tensorflow-gpu版本及其使用】

2.安装cuda9.0

（一定是要9.0版本，9.2，10.0都是坑，亲测无效！）去我的资源下载cuda9.0，（也可自行下载，参见上面博客）上传至服务器任意位置，然后使用cd到该目录下

cd /your/save/path

运行命令：

sh cuda_9.0.176_384.81_linux-run

如图所示

安装过程中刚开始会出现一大堆类似文档的东西，疯狂空格就行

Do you accept the previously read EULA?
accept/decline/quit: accept（没什么好说的了直接敲accept）
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 396.26? 这里是说是否安装显卡驱动，一定要选no！
Do you want to install the OpenGL libraries? 这是nvidia自己的opencv 没有用的,要用就用直接的opencv官网安装也很简单，所以这n
Install the CUDA 9.2 Toolkit? 是否安装，当然yes
Enter Toolkit Location
default is /usr/local/cuda-9.2 : 这个一定不要用默认的，因为没有su权限，目录选到自己home下例如：/home/wushuai/

配置环境变量：找到.bashrc文件，在最后一行添加

export PATH=/your cuda installation path/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/your cuda installation path/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} 
export CUDA_HOME=/your cuda installation path/ 
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/your cuda installation path/extras/CUPTI/lib64

保存即可。（如果找不到.bashrc文件应该是被隐藏了，返回你登录时的目录下点一下这个图标就可以，ps:“your conda installation path”，就是到conda这个文件夹，“/your/save/path”等是指要你改成你的路径，我曾经看到有人没改直接就输入了。。。）

3.安装cudnn

查看所需cudnn版本，

cat /your cuda installation path/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

如图我的CuDNN版本为7.3.1,如果你的也是7.3.1去我的资源下载即可，否则自己去官网下载适合自己的版本。

安装cudnn比较简单，简单地说，将cudnn上传到和cuda同一个目录下。这样解压时，不用自己操作即可将cudnn文件复制到cuda文件夹中。然后复制几个文件：库文件和头文件。将cudnn的头文件复制到cuda安装路径的include路径下，将cudnn的库文件复制到cuda安装路径的lib64路径下。具体操作如下

#解压文件
tar -xzvf cudnn-9.0-linux-x64-v7.3.1.20.tgz

#切换到刚刚解压出来的文件夹路径
cd cuda 
#复制include里的头文件（记得转到include文件里执行下面命令）
sudo cp /include/cudnn.h  /usr/local/cuda/include/
 
#复制lib64下的lib文件到cuda安装路径下的lib64（记得转到lib64文件里执行下面命令）
sudo cp lib*  /usr/local/cuda/lib64/
 
#设置权限
sudo chmod a+r /usr/local/cuda/include/cudnn.h 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
 
#======更新软连接======
cd /usr/local/cuda/lib64/ 
sudo rm -rf libcudnn.so libcudnn.so.7   #删除原有动态文件，版本号注意变化，可在cudnn的lib64文件夹中查看   
sudo ln -s libcudnn.so.7.3.1 libcudnn.so.7  #生成软衔接（注意这里要和自己下载的cudnn版本对应，可以在/usr/local/cuda/lib64下查看自己libcudnn的版本）
sudo ln -s libcudnn.so.7 libcudnn.so #生成软链接
sudo ldconfig -v #立刻生效

cudnn安装完毕

4.安装anacanda3，去我的资源下载anacanda或者去镜像（推荐清华镜像）（官网下载的最新版本有坑，慎重，推荐python版本为3.6的anacanda3，我安装的是anacanda3-5.3.0），然后上传至服务器任意位置，然后cd到该目录下

cd /your/save/path

运行命令：

sh Anaconda3-5.3.0-Linux-x86_64.sh

配置环境变量，找到.bashrc文件，在最后一行添加export PATH="/your anaconda installation path/bin:$PATH"，保存即可。

5.安装tensorflow-gpu，输入命令：

pip install tensorflow-gpu

验证是否安装成功：

进入python（输入python即可）

输入如下代码

import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))

下方有大段显示GPU信息表示安装成功

至此大功告成！！！

另外有几点注意：

1.我参考的那篇博客用虚拟环境装的tensorflow，其实用不用都行，我都试了。激活环境，我没有切换镜像，网速慢是个大问题，昨晚到11.30一直下载包失败，重复好多次，今早七点就起了，重新执行激活环境的命令，网速很快，一会就好了

2.安装tensorflow-gpu不成功，可能没指定版本，结果安装最新的，与cuda版本不配，然后又百度与cuda和cudnn版本对应的tensorflow-gpu版本，重新下载，就成功了。

3.总结一下，成功前提是服务器权限开放，成功经验是多问问实验室有经验的+找靠谱博客

azeyeazeye

关注

2
点赞
踩
38

收藏

觉得还不错? 一键收藏
0
评论
实验室服务器安装cuda9.0，cudnn，Anaconda，tensorflow-gpu（小白教程）

昨天的刚接触服务器，今天就可以跑模型了，还挺爽的。系统：本地windows，服务器 Centos7 ，64位安装包：MobaXterm，cuda9.0，cudnn，Anaconda（资源下载链接：https://pan.baidu.com/s/16YbybsV3jTjKDm48tcVg4A 提取码：ng64）1.安装MobaXterm（是自己电脑与服务器远程连接的...
复制链接

扫一扫