ubunbu深度学习环境配置(服务器驱动安装,cuda驱动安装、cudnn安装)

由于最近公司新购买的服务器,需要配置训练环境,简单记录下服务器的驱动安装。

1、安装ubuntu18.04 server版本,具体操作自行百度。

2、网络设置。

ifconfig查看当前网卡。一般都会有两块以上的网卡,具体设备可能不太一致。

Ubuntu从17.10开始,已放弃在/etc/network/interfaces里配置IP地址,即使配置也不会生效,而是改成netplan方式,配置写在/etc/netplan/50-cloud-init.yaml文件里。

#配置动态IP
network:
    ethernets:                  #自己网卡名称[或者名称为eno1,eth1等]
        ens33:                  # 配置的网卡名称
            dhcp4: yes           # 关闭dhcp4
            dhcp6: yes           # 关闭dhcp6
    version: 2

#配置静态IP
network:
    ethernets:
        ens33:                  # 配置的网卡名称
            dhcp4: no           # 关闭dhcp4
            dhcp6: no           # 关闭dhcp6
            addresses: [192.168.0.120/24]       # 设置本机IP地址及掩码
            gateway4: 192.168.0.1               # 设置网关
            nameservers:
                    addresses: [114.114.114.114, 8.8.8.8]       # 设置DNS
    version: 2

配置完成后,退出执行netplan apply.

验证是否配置成功:ifconfig -a

验证是否能够ping通外网:ping -c 4 baidu.com

3、安装服务器驱动:

首先添加源:

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

检查可以安装的驱动版本:

ubuntu-drivers devices

选择最合适的版本安装即可

sudo apt install nvidia-driver-XXX

重启Ubuntu系统,使用nvidia-smi检查驱动信息。

4、安装cuda

进入nvidia开发者网站的CUDA下载页面:https://link.zhihu.com/?target=https%3A//developer.nvidia.com/cuda-toolkit-archive

选择runfile格式的CUDA文件下载,

下载完成后,解压,并运行上图中的命令,会有条款,接受即可,注意安装CUDA的时候不要安装驱动(因为在第一步我们已经安装过了)。

安装完成后,

sudo vim ~/.bashrc

 在文件末尾添加:

$ export PATH=/usr/local/cuda-10.1/bin:/usr/local/cuda-10.1/NsightCompute-2019.1${PATH:+:${PATH}}
$ export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64\
                         ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

最后,使刚才的配置生效

source ~/.bashrc

 5、测试。

进入/usr/local/cuda-10.1/samples/1_Utilities/目录,

cd deviceQuery
sudo make
./deviceQuery

 出现如下输出,则CUDA安装成功。

6、安装cudnn

 进入页面:https://link.zhihu.com/?target=https%3A//developer.nvidia.com/cudnn下载对应的版本(cudnn for linux)

然后解压,并进入到相应的目录,运行以下命令:(注意下载的cudnn文件可能后缀为solitairetheme8,直接修改为tar 执行tar zxvf  *.tar就行)

sudo cp cuda/include/cudnn.h /usr/local/cuda-10.1/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h 
sudo chmod a+r /usr/local/cuda-10.1/lib64/libcudnn*

 配置好cudnn的环境之后,使用以下命令查看当前版本。

cat /usr/local/cuda-10.1/include/cudnn.h | grep CUDNN_MAJOR -A 2

注意,上述命令中的cuda-10.1只是作者安装时的cuda版本,各位小伙伴按照自己情况修改为对应的版本就OK。

至此安装告一段落。

7、创建新的用户

由于服务器上操作时一般不使用root用户,当需要创建新的用户时,使用

sudo adduser ***   #这样创建较为简单

接着按照提示,配置密码和相应信息,就行了。

用户配置自己的cuda版本。

当系统安装的cuda版本和自己的使用的不匹配时,非root用户也可以在自己的环境下安装其他版本的cuda。

首先需要在前面给出的网站上,下载对应版本的cuda和cudnn。(注意:有说法非root用户安装的cuda版本不能大于系统版本)

接着修改下载的runfile的权限:

chmod 755 cuda_10.0.130_410.48_linux.run
sh cuda_10.0.130_410.48_linux.run   #不使用sudo权限

在安装过程中会有安装选项询问,注意此时不要再安装驱动,同时需要修改安装的路径,安装到当前用户目录下(默认的为/user/local,权限不足)。

完成后,进入安装路径,执行下面的命令:

cd samples 
cd deviceQuery
sudo make
./deviceQuery

出现下面的命令,代表安装成功

将cuda的安装路径写入到当前用户的环境变量中 ,略。

8、配置cudnn

 略.

 

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值