Centos7 GPU环境搭建:tensorflow=1.14.0/2.0+ + CUDA=7.6.0 +cudnn=10.1

一、NVIDIA驱动安装

1、禁用系统驱动 nouveau

vi /etc/modprobe.d/blacklist.conf

注释掉 blacklist nvidiafb
添加两行:
blacklist nouveau
options nouveau modeset=0
如果没有blacklist.conf文件,执行

echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf

重新建立initramfs image文件(生成新的内核,这个内核在开机的时候不会加载nouveau驱动程序,确保文件目录空间足够,否则报错)

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)

重启 reboot
查看nouveau是否启动,如果结果为空即为禁用成功

lsmod | grep nouveau

2、(本人用的第二种方式,两种方式的驱动型号可能会不一样)
第一种方式:可以去NVIDIA官网下载对应的驱动,一步步安装就可以

sudo sh ./NVIDIA-Linux-x86_64-375.39.run 

第二种方式:检测可安装的显卡驱动
添加ELPepo源(可获取最新版本

sudo rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
sudo yum install https://www.elrepo.org/elrepo-release-7.0-4.el7.elrepo.noarch.rpm

安装显卡检测程序并执行

sudo yum install nvidia-detect
nvidia-detect

会看到nvidia驱动型号,下一步直接在线安装

sudo yum  -y install kmod-nvidia

重启 reboot
执行下面命令可看到gpu信息

nvidia-smi

在这里插入图片描述

二、CUDA安装

1、nvidia官网选择合适的版本
在这里插入图片描述
2、cuda安装(安装10.1的update版本总是卡住,换成了原版顺利执行)
在这里插入图片描述

sh cuda_10.1***_linux.run

执行过程中驱动选择不安装
+[x] driver
将该项x去掉,然后选择install,等待就好了,安装很快,没有遇到opengl的问题。
3、检查cuda安装成功
到CUDA_Samples的安装目录

cd /root/cuda/NVIDIA_CUDA-10.1_Samples/1_Utilities/deviceQuery
make
./deviceQuery

make时如果有报错,看是不是没有安装g++,没有的话,yum 安装即可。

sudo yum -y install gcc gcc-c++

显示版本信息,则为安装成功。

三、cudnn安装

1、nvidia官网下载对应版本的cudnn需要有NVIDIA账号。
在这里插入图片描述
2、解压cudnn并添加到cuda相关目录(cuda安装目录),修改文件权限。

tar -xzvf cudnn-7.6.0-linux-x64-v5.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

四、tensorflow-gpu安装

1、使用Anaconda环境,anaconda官网下载或在线下载(推荐)。

wget https://repo.anaconda.com/archive/Anaconda3-2020.02-Linux-x86_64.sh
sh Anaconda3-2020.02-Linux-x86_64.sh

安装过程中都选yes就可以了。
2、安装过程中,conda会添加到环境变量,安装完成后,需要更新环境变量使conda生效。

source /etc/profile
conda
source deactivate # 退出默认的base环境

不在虚拟环境的话,可以将系统python指定为anaconda的python

vim /etc/profile

添加两行
PATH=$PATH:/root/anaconda3/bin #路径名跟自己实际情况而定
export PATH
3、tensorflow-gpu安装
anaconda默认国外源,下载较慢,可改为清华源
(此处安装tf1.14版本,其实安装**tf2.0+**版本也没有问题)

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda install tensorflow-gpu==1.14.0
pip install keras   #conda会安装多余的依赖

可在python环境 import tensorflow 一下
安装完成!

五、小贴士(欢迎补充)

1、安装中可能有CUDA_Version与RunTime_Version不一致的情况,不影响,保证CUDA_Version >= RunTime_Version就可以。
2、不建议更改anaconda的安装路径。有可能导致训练过程中,显存可能会占满,但GPU利用率为0,此时建议卸载重装tensorflow-gpu和keras或者anaconda。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
CentOS 中启动应用程序的方法有多种,下面介绍两种常用的方法。 1. 使用 Systemd 启动应用程序 Systemd 是一个常用的服务管理工具,可以用来启动、停止和管理系统服务。使用 Systemd 启动应用程序的步骤如下: - 创建一个新的 Systemd 服务文件 `/etc/systemd/system/myapp.service`,并编辑该文件,设置服务的名称、描述、启动命令等信息。例如: ```ini [Unit] Description=My Application After=network.target [Service] WorkingDirectory=/path/to/your/app ExecStart=/path/to/your/app/myapp Restart=always User=myuser [Install] WantedBy=multi-user.target ``` - 保存文件并退出编辑器。然后执行以下命令,启动和开机自启动该服务: ```shell sudo systemctl daemon-reload sudo systemctl start myapp.service sudo systemctl enable myapp.service ``` - 使用以下命令检查服务的状态: ```shell sudo systemctl status myapp.service ``` 2. 使用 nohup 启动应用程序 nohup 命令可以在后台运行应用程序,并将输出重定向到一个文件中。使用 nohup 启动应用程序的步骤如下: - 进入应用程序目录: ```shell cd /path/to/your/app ``` - 使用以下命令启动应用程序: ```shell nohup ./myapp > myapp.log 2>&1 & ``` 这个命令会在后台运行 `myapp` 程序,并将输出重定向到 `myapp.log` 文件中。 - 使用以下命令检查程序是否在运行: ```shell ps aux | grep myapp ``` 希望这些方法可以帮助你启动应用程序。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值