GPU分析服务部署环境搭建

 

关键词:

GPU分析、容器化、Docker

摘  要:

介绍在Linux环境下搭建GPU分析容器化部署所需要的环境。

目录

一、配置环境要求

二、Linux系统安装

        1、分区

        2、独立数据分区挂载

三、服务配置及显卡驱动安装

        1、关闭防火墙

        2、关闭selinux

        3、禁用nouveau

四、Docker安装

        1、卸载旧版本docker

        2、安装docker

        3、docker目录修改      


一、配置环境要求

        本文仅以Linux环境为例,相关软硬件基本要求如下表:

硬件环境

CPU

Intel(R) Core(TM) i7-6700 CPU @ 3.40GHz

内存

32GB

GPU

GeForce RTX 2070 Super * 2

硬盘

SSD 240GB

软件环境

宿主机系统

CentOS 7.8.2003

显卡驱动

NVIDIA-Linux-x86_64-440.82 或者

NVIDIA-Linux-x86_64-450.80.02

二、Linux系统安装

        本文对于系统的安装不作详细介绍,只重点说明几个配置。

        1、分区

分区步骤

挂载点

说明

分区类型

说明

第一步

/boot/efi

200M

默认

或biosboot分区,2M

第二步

/boot

2GB

默认

第三步

/

剩下全部空间

ext4

        2、独立数据分区挂载

        如果安装系统sda足够大,不需要挂载,直接在根目录“/”下,通过“mkdir /data”命令创建“/data”目录。

         如果是数据盘和系统盘分离,需要挂载数据盘。

fdisk /dev/sdb      # sdb是第二块盘,现场根据实际选择。

g:GPT分区,分区前必选!GPT支持2T以上磁盘。

n:创建新分区

p:查看分区

w:保存分区信息

m:帮助

通过 mkfs.ext4格式化成ext4格式。

修改挂载文件:vi /etc/fstab,增加一行(vi中,按“o”增加一行):

/dev/sdb1  /data  ext4  defaults  0 0

按esc,输入:wq,保存退出vi。

“mkdir /data”创建/data文件夹,mount -a完成挂载,df -h查看是否成功。

三、服务配置及显卡驱动安装

        1、关闭防火墙

# systemctl stop firewalld.service
# systemctl disable firewalld.service
# systemctl status firewalld.service

        2、关闭selinux

# vi /etc/selinux/config

  将SELINUX=enforcing改为SELINUX=disabled 重启生效。

   查看状态:

# getenforce

        3、禁用nouveau

查看该目录/etc/modprobe.d有无blacklist.conf文件,没有则创建一个,添加如下内容

blacklist nouveau

options nouveau modeset=0

保存之后,运行如下命令

# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

# dracut -v /boot/initramfs-$(uname -r).img

然后reboot,输入命令lsmod | grep nouveau查看禁用是否成功了,如下图即表示禁用成功

         4、驱动安装

注意宿主机上面需要安装gcc环境,同时保证uname -rrpm -q kernel-devel的版本一致。

本文以NVIDIA-Linux-x86_64-440.64.run版本为例,直接运行NVIDIA-Linux-x86_64-440.64.run,命令如下:

# chmod 777 NVIDIA-Linux-x86_64-440.64.run

# ./NVIDIA-Linux-x86_64-440.64.run

输入accept接受协议,安装选项中,仅选安装驱动即可,安装完成后reboot重启 nvidia-smi查看gpu相关信息,如下图:

四、Docker安装

        1、卸载旧版本docker

                如果之前没有安装过,可跳过这一步。

$ sudo yum remove docker \
					  docker-client \
					  docker-client-latest \
					  docker-common \
					  docker-latest \
					  docker-latest-logrotate \
					  docker-logrotate \
					  docker-selinux \
					  docker-engine-selinux \
					  docker-engine

# rm -rf /etc/systemd/system/docker.service.d
# rm -rf /var/lib/docker
# rm -rf /var/run/docker

        2、安装docker

        准备好以下docker rpm包:

      以及下面的nvidia rpm包

        里面的rpm一次批量安装即可,cd到该目录,执行rpm -Uvh *.rpm --nodeps --force即可,如果是GPU服务器,还需要安装nvidia的rpm包,安装方法一样。

启动docker:

# systemctl start docker

        3、docker目录修改      

  1. 查看docker当前目录
    # docker info

  2. 停止docker
    # systemctl stop docker
  3. 修改数据目录配置
    # vi /usr/lib/systemd/system/docker.service
    # 增加数据目录配置:--graph=/data/docker

    # systemctl daemon-reload 		  # 重新加载配置
    # systemctl restart docker         # 重启docker
    # systemctl enable docker         # 设置开机自启动
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
深度学习环境搭建需要配置GPU,以下是一些基本步骤: 1. 安装Anaconda:Anaconda是一个开源的Python发行版本,可以方便地管理Python环境和包。可以从Anaconda官网下载并安装Anaconda。 2. 安装CUDA和CUDNN:CUDA是NVIDIA提供的用于GPU计算的并行计算平台,CUDNN是用于深度神经网络加速的库。首先需要安装NVIDIA显卡驱动程序,然后安装CUDA和CUDNN。具体的安装步骤可以参考相关文档或教程。 3. 安装PyTorch:PyTorch是一个开源的Python深度学习库,可以用于构建和训练神经网络模型。可以使用conda或pip命令安装PyTorch。 4. 安装PyCharm:PyCharm是一个集成开发环境(IDE),可以用于编写和运行Python代码。可以从PyCharm官网下载并安装PyCharm。 5. 创建虚拟环境:可以使用Anaconda创建虚拟环境,以便在不同的项目中使用不同的Python环境和包。可以使用conda命令创建和激活虚拟环境。 在搭建好深度学习环境后,你可以使用PyTorch进行深度学习任务。PyTorch是一种深度学习网络的框架,可以用于构建、训练和部署神经网络模型。深度学习框架提供了一套积木,你可以根据自己的需求选择和组装这些积木,以构建适合你的数据集的模型。使用深度学习框架可以降低入门门槛,因为你可以使用已有的模型和组件,而不需要从头开始编写复杂的神经网络代码。然而,不同的框架适用于不同的领域,所以你需要根据自己的需求选择合适的框架。 #### 引用[.reference_title] - *1* [完整教程:深度学习环境配置(GPU条件&pytorch)](https://blog.csdn.net/meiyoushui_/article/details/126843719)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [从0开始搭建深度学习环境-Pytorch-GPU](https://blog.csdn.net/weixin_44097477/article/details/123411320)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值