Table of Contents
系统配置
- CPU: Intel Xeon4114 *2
- GPU: Nvidia Tesla V100 * 2
- 操作系统: Centos 7
- Anaconda版本: 2019.10
- 显卡驱动版本: 410.129
- tensorflow: tensorflow-gpu:2.0
系统安装
- centos 7.7 镜像文件下载: CentOS-7-x86_64-Everything-1908.iso
- 使用rufus制作启动盘
- 安装系统
切换国内镜像站
参见:CentOS 镜像
su
mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
yum makecache
安装Anaconda
- 下载安装包Anaconda3-2019.10-Linux-x86_64.sh
- 运行以下命令安装
cd <Directory of Anaconda3 Installer> #Anaconda3安装包所在路径
chmod +x Anaconda3-2019.10-Linux-x86_64.sh
./Anaconda3-2019.10-Linux-x86_64.sh # 安装过程中全部选yes
- 安装完成后退出terminal,重新打开
- 切换清华大学 开源软件镜像站
cd
conda config --set show_channel_urls yes
gedit .condarc
- 向文件中复制如下内容:
channels:
- defaults
show_channel_urls: true
channel_alias: https://mirrors.tuna.tsinghua.edu.cn/anaconda
default_channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
- 清除索引缓存
conda clean -i
安装显卡驱动
参考:CentOS 7中以runfile形式安装CUDA 9.0
- 切至root用户
su
- 确保电脑上安装了nvidia显卡
lspci | grep -i nvidia
- 安装需要的软件
yum install -y gcc gcc-c++
- 安装kernel header
yum install -y kernel-devel-$(uname -r) kernel-headers-$(uname -r)
- 列出Nouveau驱动
lsmod | grep nouveau
- 新建blacklist-nouveau.conf,禁用Nouveau驱动
gedit /usr/lib/modprobe.d/blacklist-nouveau.conf
- 在配置文件中输入如下内容:
blacklist nouveau
options nouveau modeset=0
- 重新生成kernel inittramfs:
sudo dracut --force
- 设置默认启动方式为“text mode”
systemctl set-default multi-user.target
init 3
- 重启计算机
计算机重启后进入命令行界面,输入用户名和密码进行登陆,登陆后安装驱动即可。
- 驱动安装完成后,运行以下命令,切换会图形界面。
systemctl set-default graphical.target
init 5
安装cuda & cudnn
- 切换至cuda安装包所在目录,运行:
chmod +x cuda_10.0.130_410.48_linux.run
sudo ./cuda_10.0.130_410.48_linux.run
- 请勿安装cuda默认的驱动程序!!
- 在".bashrc"中添加:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
- 下载并安装cudnn7.6.5
rpm -ivh libcudnn7-*.x86_64.rpm
rpm -ivh libcudnn7-devel-*.x86_64.rpm
rpm -ivh libcudnn7-doc-*.x86_64.rpm
- 验证安装是否成功
cp -r /usr/src/cudnn_samples_v7/ $HOME
cd $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN
- 下载并安装nccl2.5
rpm -ivh nccl-repo-rhel7-2.5.6-ga-cuda10.0-1-1.x86_64.rpm
安装tensorflow-gpu
conda create -n tf tensorflow-gpu=2.0
激活环境并运行python
conda activate tf
python
在python命令提示符后输入:
import tensorflow as tf
tf.test.is_gpu_available()
返回‘True’,表示tensorflow-gpu可用。