ubunbu深度学习环境配置（服务器驱动安装，cuda驱动安装、cudnn安装）

最新推荐文章于 2024-07-05 00:01:39 发布

Soheyi

最新推荐文章于 2024-07-05 00:01:39 发布

阅读量359

点赞数 1

分类专栏：其他

本文链接：https://blog.csdn.net/Soheyi/article/details/108055234

版权

其他专栏收录该内容

6 篇文章 0 订阅

订阅专栏

由于最近公司新购买的服务器，需要配置训练环境，简单记录下服务器的驱动安装。

1、安装ubuntu18.04 server版本，具体操作自行百度。

2、网络设置。

ifconfig查看当前网卡。一般都会有两块以上的网卡，具体设备可能不太一致。

Ubuntu从17.10开始，已放弃在/etc/network/interfaces里配置IP地址，即使配置也不会生效，而是改成netplan方式，配置写在/etc/netplan/50-cloud-init.yaml文件里。

#配置动态IP
network:
    ethernets:                  #自己网卡名称[或者名称为eno1,eth1等]
        ens33:                  # 配置的网卡名称
            dhcp4: yes           # 关闭dhcp4
            dhcp6: yes           # 关闭dhcp6
    version: 2

#配置静态IP
network:
    ethernets:
        ens33:                  # 配置的网卡名称
            dhcp4: no           # 关闭dhcp4
            dhcp6: no           # 关闭dhcp6
            addresses: [192.168.0.120/24]       # 设置本机IP地址及掩码
            gateway4: 192.168.0.1               # 设置网关
            nameservers:
                    addresses: [114.114.114.114, 8.8.8.8]       # 设置DNS
    version: 2

配置完成后，退出执行netplan apply.

验证是否配置成功：ifconfig -a

验证是否能够ping通外网：ping -c 4 baidu.com

3、安装服务器驱动：

首先添加源：

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

检查可以安装的驱动版本：

ubuntu-drivers devices

选择最合适的版本安装即可

sudo apt install nvidia-driver-XXX

重启Ubuntu系统，使用nvidia-smi检查驱动信息。

4、安装cuda

进入nvidia开发者网站的CUDA下载页面：https://link.zhihu.com/?target=https%3A//developer.nvidia.com/cuda-toolkit-archive

选择runfile格式的CUDA文件下载，

下载完成后，解压，并运行上图中的命令，会有条款，接受即可，注意安装CUDA的时候不要安装驱动（因为在第一步我们已经安装过了）。

安装完成后，

sudo vim ~/.bashrc

在文件末尾添加：

$ export PATH=/usr/local/cuda-10.1/bin:/usr/local/cuda-10.1/NsightCompute-2019.1${PATH:+:${PATH}}
$ export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64\
                         ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

最后，使刚才的配置生效

source ~/.bashrc

5、测试。

进入/usr/local/cuda-10.1/samples/1_Utilities/目录，

cd deviceQuery
sudo make
./deviceQuery

出现如下输出，则CUDA安装成功。

6、安装cudnn

进入页面：https://link.zhihu.com/?target=https%3A//developer.nvidia.com/cudnn下载对应的版本（cudnn for linux）

然后解压，并进入到相应的目录，运行以下命令：（注意下载的cudnn文件可能后缀为solitairetheme8，直接修改为tar 执行tar zxvf *.tar就行）

sudo cp cuda/include/cudnn.h /usr/local/cuda-10.1/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h 
sudo chmod a+r /usr/local/cuda-10.1/lib64/libcudnn*

配置好cudnn的环境之后，使用以下命令查看当前版本。

cat /usr/local/cuda-10.1/include/cudnn.h | grep CUDNN_MAJOR -A 2

注意，上述命令中的cuda-10.1只是作者安装时的cuda版本，各位小伙伴按照自己情况修改为对应的版本就OK。

至此安装告一段落。

7、创建新的用户

由于服务器上操作时一般不使用root用户，当需要创建新的用户时，使用

sudo adduser ***   #这样创建较为简单

接着按照提示，配置密码和相应信息，就行了。

用户配置自己的cuda版本。

当系统安装的cuda版本和自己的使用的不匹配时，非root用户也可以在自己的环境下安装其他版本的cuda。

首先需要在前面给出的网站上，下载对应版本的cuda和cudnn。（注意：有说法非root用户安装的cuda版本不能大于系统版本）

接着修改下载的runfile的权限：

chmod 755 cuda_10.0.130_410.48_linux.run
sh cuda_10.0.130_410.48_linux.run   #不使用sudo权限

在安装过程中会有安装选项询问，注意此时不要再安装驱动，同时需要修改安装的路径，安装到当前用户目录下（默认的为/user/local，权限不足）。

完成后，进入安装路径，执行下面的命令：

cd samples 
cd deviceQuery
sudo make
./deviceQuery

出现下面的命令，代表安装成功

将cuda的安装路径写入到当前用户的环境变量中，略。

8、配置cudnn

略.

Soheyi

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
ubunbu深度学习环境配置（服务器驱动安装，cuda驱动安装、cudnn安装）

由于最近公司新购买的服务器，需要配置训练环境，简单记录下服务器的驱动安装。1、安装ubuntu18.04 server版本，具体操作自行百度。2、网络设置。ifconfig查看当前网卡。一般都会有两块以上的网卡，具体设备可能不太一致。Ubuntu从17.10开始，已放弃在/etc/network/interfaces里配置IP地址，即使配置也不会生效，而是改成netplan方式，配置写在/etc/netplan/50-cloud-init.yaml文件里。#配置动态IPnetwork
复制链接

扫一扫

专栏目录