傻瓜式gpu环境配置

最新推荐文章于 2024-05-31 00:23:10 发布

浪_沏沙

最新推荐文章于 2024-05-31 00:23:10 发布

阅读量754

点赞数

分类专栏：机器学习 tensorflow python 文章标签： GPU tensorflow python centos tesla-p100

本文链接：https://blog.csdn.net/wangqi_qiangku/article/details/100089027

版权

python 同时被 3 个专栏收录

13 篇文章 0 订阅

订阅专栏

机器学习

6 篇文章 0 订阅

订阅专栏

tensorflow

3 篇文章 0 订阅

订阅专栏

服务器配置tensorflow-gpu环境

$\color{#FF0000}{基础配置：系统centos7.4，python3.6.5, gpu:tesla-p100}$

1. 配置python3.6.5

1).下载python的依赖：

yum install -y openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqlite-devel gcc gcc-c++  openssl-devel

2).下载python&安装
·下载：
wget https://www.python.org/ftp/python/3.6.5/Python-3.6.5.tgz
·解压：
tar zxvf Python-3.6.5.tgz
·解除Modules中的socket注释
cd Python-3.6.5/Modules/
vim Setup.dist
直接敲/socket搜索到socket
然后把如下代码前的#删除掉即可
#_socket socketmodule.c
#SSL=/usr/local/ssl
#_ssl _ssl.c \
# -DUSE_SSL -I$(SSL)/include -I$(SSL)/include/openssl \
# -L$(SSL)/lib -lssl -lcrypto
·回到上级目录：
cd ..
·执行配置：
./configure
·编译&安装：
make && make install
等待安装完成，python3.6.5也就安装完成了，随后可以使用
pip3 install xxx来安装你需要的python包。

2.配置gpu

0).关闭图形界面：
通常需要关闭图形界面才可以安装显卡驱动，这里可以先尝试执行命令：
service lightdm stop
init 3
如果没有信息输出，则表示已经关闭。
1).安装gpu驱动：
·执行uname -r查看内核版本号：

[root@bigdata-model01 downloads]# uname -r
3.10.0-693.2.2.el7.x86_64

·下载kernel-devel：
wget http://vault.centos.org/7.4.1708/updates/x86_64/Packages/kernel-devel-3.10.0-693.2.2.el7.x86_64.rpm
·下载kernel-header:
wget http://vault.centos.org/7.4.1708/updates/x86_64/Packages/kernel-headers-3.10.0-693.2.2.el7.x86_64.rpm
$\color{#FF0000}{这里要说下，kernel-devel和kernel-header的版本}$
$\color{#FF0000}{要和对应的内核版本号一致，一般只需要把上边链}$
$\color{#FF0000}{接里的序列号换成你的内核版本号即可，如果实在}$ $\color{#FF0000}{不行可以登录如下链接查找：}$
http://vault.centos.org/7.4.1708/updates/x86_64/Packages/

·下载完毕之后就可以使用yum进行安装了：
yum install -y kernel-devel-3.10.0-693.2.2.el7.x86_64.rpm
yum install -y kernel-headers-3.10.0-693.2.2.el7.x86_64.rpm
·执行如下命令：
rpm -qa|grep kernel

信息如下：

kernel-tools-libs-3.10.0-693.2.2.el7.x86_64
kernel-devel-3.10.0-693.2.2.el7.x86_64
kernel-3.10.0-693.el7.x86_64
kernel-3.10.0-693.2.2.el7.x86_64
kernel-headers-3.10.0-693.2.2.el7.x86_64
kernel-tools-3.10.0-693.2.2.el7.x86_64

只要三者的数字完全一模一样就可以了。
2).安装cuda：

·查看tensorflow版本：
pip3 list|grep tensorflow
我这里安装的是tensorflow==1.11.0
·查看tensorflow版本对应兼容版本,这里有一个表格也可以在tensorflow官网上查看:

版本	Python 版本	编译器	编译工	cuDNN	CUDA
tensorflow_gpu-2.0.0-alpha0	2.7、3.3-3.6	GCC 4.8	Bazel 0.19.2	7.4.1以及更高版本	CUDA 10.0 (需要 410.x 或更高版本)
tensorflow_gpu-1.13.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.19.2	7.4	10.0
tensorflow_gpu-1.12.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.15.0	7	9
tensorflow_gpu-1.11.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.15.0	7	9
tensorflow_gpu-1.10.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.15.0	7	9
tensorflow_gpu-1.9.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.11.0	7	9
tensorflow_gpu-1.8.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.10.0	7	9
tensorflow_gpu-1.7.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.9.0	7	9
tensorflow_gpu-1.6.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.9.0	7	9
tensorflow_gpu-1.5.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.8.0	7	9
tensorflow_gpu-1.4.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.5.4	6	8
tensorflow_gpu-1.3.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.4.5	6	8
tensorflow_gpu-1.2.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.4.5	5.1	8
tensorflow_gpu-1.1.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.4.2	5.1	8
tensorflow_gpu-1.0.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.4.2	5.1	8

进入网址https://developer.nvidia.com/cuda-downloads
然后选择对应的系统，下载即可，这里下载的是runfile.
·加环境变量：
vim ~/.bash_profile

PAHT=$PATH:/usr/local/cuda-9.0/bin
export PATH
LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export LD_LIBRARY_PATH
保存退出。
source ~/.bash_profile
./cuda_9.0.176_384.81_linux-run
这里建议在安装cuda的时候自动下载对应的driver，
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: y
如果需要手动安装cuda驱动的如下见步骤3.
安装完之后可以测试。
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
如果安装成功会有如下显示：
[外链图片转存失败(img-wFdsnP2p-1566865425344)(media/15668060198682/15668651060536.jpg)]

3).安装cuda驱动
如果在2)中这一步中选择的如下：
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: y
请移步到4).
·登录nvidia的官网下载对应的驱动：
https://www.nvidia.cn/Download/index.aspx?lang=cn

·点击搜索在这里插入图片描述完毕之后出现如下图片：
[外链图片转存失败(img-WO41j5Sk-1566865425351)(media/15668060198682/15668087584881.jpg)]

·点击下载按钮跳转到：
在这里插入图片描述 ·右键下载按钮，复制链接地址，然后在服务器上执行：
wget http://cn.download.nvidia.com/tesla/384.183/NVIDIA-Linux-x86_64-384.183.run
当然这个链接地址是我的，你根据你复制的替换掉即可。
·然后执行命令：
chmod +x NVIDIA-Linux-x86_64-384.183.run
./NVIDIA-Linux-x86_64-384.183.run
·安装完成执行：
nvidia-smi
如果现实如下： [外链图片转存失败(img-tJXnvR4H-1566865425362)(media/15668060198682/15668122416783.jpg)]

4).安装cudnn
·去官网下载对应的cudnn包，但是需要注册账号，也可以使用微信或者qq登录。
https://developer.nvidia.com/rdp/cudnn-archive
因为是主要注册才能下载，所以要下载到本地再利用rz或者别的工具上传到服务器，这里不做详细解释。
·下载完之后直接解压：
tar zxvf cudnn-9.0-linux-x64-v7.5.1.10.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

5).测试
import tensorflow as tf
tf.test.gpu_device_name()
tf.test.is_gpu_available()
若果安装成功，这些都应该正常输出gpu的信息。

浪_沏沙

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
傻瓜式gpu环境配置

服务器配置tensorflow-gpu环境基础配置：系统centos7.4，python3.6.5,gpu:tesla−p100\color{#FF0000}{基础配置：系统centos7.4，python3.6.5,gpu:tesla-p100}基础配置：系统centos7.4，python3.6.5,gpu:tesla−p1001. 配置python3.6.51).下载python的...
复制链接

扫一扫