CentOS tensorflow-gpu 搭建

CentOS tensorflow-gpu 搭建

步骤

  1. 检查是否电脑配置有Nvidia显卡

    $ /usr/sbin/lspci | grep -i nvidia
    执行结果:
    00:07.0 3D controller: NVIDIA Corporation GP100GL (rev a1)`
    
  2. 执行命令:
 
  1. yum install -y "kernel-devel-uname-r == $(uname -r)"
  2. yum -y install gcc kernel-devel kernel-headers

如果安装失败,下载系统同版本的iso镜像(镜像地址),用iso手动安装kernel,CentOS7配置本地软件源

  1. 屏蔽默认带有的nouveau

    打开/lib/modprobe.d/dist-blacklist.conf将blacklist nvidiafb注释掉。
    (注意是lib下的modeprobe.d而不是 etc下的)
    然后添加以下语句:
    blacklist nouveau
    options nouveau modeset=0
    
  2. 重建initramfs image步骤

    mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
    dracut /boot/initramfs-$(uname -r).img $(uname -r)
    
  3. 修改运行级别为文本模式 systemctl set-default multi-user.target

  4. reboot
  5. 查看nouveau是否已经禁用 ls mod | grep nouveau 如果没有显示相关内容,说明禁用成功
  6. 修改运行级别回图形模式 systemctl set-default graphical.target 或者startx
  7. 下载NVIDIA*.run文件直接运行
  8. nvidia-smi 查看信息是否显示成功(安装cuda时不能用默认的cuda gpu系统覆盖此gpu驱动,要选no)

问题:

发现nouveau一直关闭不了,暂时不知为何

参考

Centos7安装独立显卡驱动
CentOS7配置本地软件源
cuda 安装成功检测
linux挂载命令mount及U盘、移动硬盘的挂载

  1. 安装kdims

    yum install epel-release
    yum install dkms
    

9. 下载cuda版本

    rpm -i cuda-repo-rhel7-9-0-local-9.0.176-1.x86_64.rpm(可能会出现无签名警告,无大碍)
    yum clean all
    yum install cuda

或者:

    sudo sh cuda_10.0.130_410.48_linux.run

如果rpm了一个版本的cuda,那么通过yum install cuda 是无法安装新的cuda的,那么通过yum install cuda-10*可以安装10的版本cuda
  1. 环境配置

10.1 加入路径 vim /etc/profile
最后一行加入:
#设置cuda8.0环境变量
export PATH=$PATH:/usr/local/cuda-8.0/bin

10.2 设置函数库位置
进入/etc/ld.so.conf.d
新建文件cuda.conf,然后在其中加入
/usr/local/cuda-8.0/lib64
/usr/local/cuda-8.0/lib
在root用户下执行:ldconfig

10.3 vim ~/.bashrc
在最后加入以下两行:
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
保存然后执行:source ~/.bashrc

10.4 测试
nvcc -V 查看是否有cuda版本

问题:reboot、cp、ls等原生命令都用不了。
解决:使用命令export查看PATH值存在问题,再临时修改PATH值export PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin
1.root用户下bash: reboot :command not found
2.-bash: reboot: command not found
修改/etc/profile文件还是不对(但是必须保证次文件正确)
再查看.bash_profile文件也没文化体
最后查看了~/.bashrc文件发先export PATH=...中少了$
正确的PATH径为:/usr/local/cuda-9.0/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin或者后置cuda路径,查看命令echo $PATH

  1. cudnn安装,注册,下载对应版本的cudnn
    cudnn
    tar -zxvf cudnn-9.0-linux-x64-v7.1.solitairetheme8
    sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
    sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
    sudo chmod a+r /usr/local/cuda/include/cudnn.h
    sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

  2. 设置cudnn路径 ldconfig /usr/local/cuda/lib64

参考

centos7安装tensorflow-gpu版本
CUDA 8.0在Linux上的安装流程

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值