【亲测有效】Linux深度学习工作站配置

〇.引言

本文揉杂网上各种信息(几乎无原创性),再根据自己遇到的各种突发状况,做出一个整合。

一.前言

新到实验室,组里没有现成的服务器配置,拿到一个素主机,遂开始配置自己的深度学习工作站。本人的办公电脑为Macbook pro,目的是使用远程ssh连接服务器跑代码,并且做到SFTP,目前没有使用图形界面的需要。

二.硬件介绍

戴尔Precision 7920塔式工作站3090版

  • CPU:Intel Xeon Sliver 4214R
  • 内存:三星DDR4 32GBx2
  • 显卡:RTX3090 24G
  • 硬盘:固态 三星512G 机械 东芝2T

远程平台
Macbook pro

  • Termius连接服务器
  • Vscode编辑代码并在服务器运行

三.安装Linux系统

3.1 下载iso镜像

Ubuntu 20.04.6 LTS(Focal Fossa),下载Desktop image版本

3.2 制作系统盘

选择一个空U盘,容量大于4G即可

下载UltraISO->打开软件-启动-写入硬盘映像->将刚才下载好的Ubuntu写入至U盘中

至此U盘变成系统盘

3.3 安装

重启电脑->开机按del或者F12->进入Ubuntu->选择Install->一直下一步使用默认配置

至此电脑中安装Ubuntu成功

四、配置

4.1 换清华源

为提升下载包的速度,如果不是有很好的vpn,建议要替换源

更换清华源

4.2 下载miniconda

日常使用中,不同的模型很有可能使用不同版本的python和包运行,使用miniconda进行环境管理可以提升工作效率

#去官网下载miniconda
https://docs.conda.io/en/latest/miniconda.html
#第二步安装
cd到下载的目录然后使用bash下载
bash Miniconda3-py39_4.9.2-Linux-x86_64.sh
#第三步 更改清华源
source ~/.bashrc
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda
conda config --set show_channel_urls yes

创建个环境,下几个包

conda create -n cv python=3.8 #创建一个名称为cv的环境,默认下载python3.8
#下载各种包,这里使用pip和conda下载都是一样的,看哪个资源好速度快就用哪个
pip install opencv-python
conda install numpy

#常用命令
#查看已有环境
conda info --env
#查看已有安装包
conda list
#退出环境
conda deactivate
#删除某个环境
conda remove -n 环境名 --all
#删除某个环境下的某个包
conda remove -n 环境名 包名

4.3 安装nvidia显卡驱动

这里仅提及英伟达的显卡驱动

nvidia-smi #查看显卡是否驱动
#若未驱动,则需要安装驱动
https://www.nvidia.cn/geforce/drivers/ #下载显卡驱动,文件格式为.run
4.3.1 禁用nouveau

#禁用nouveau
sudo vim /etc/modprobe.d/blacklist.conf
#找到键盘上的Insert,在最后一行嵌入
blacklist nouveau
#Esc后输入
:wq或:wq!  
#保存修改,Ctrl+z退出
#执行关闭命令
sudo update-initramfs -u
#重启电脑,手动重启或执行命令
sudo reboot now
#检查是否禁用成功,输入
lsmod | grep nouveau. #若无输出代表禁用成功
4.3.2 安装nvidia
#cd到文件夹下安装nvidia
sudo chmod a+x NVIDIA-Linux-*******.run
sudo sh ./NVIDIA-Linux-*******.run -no-opengl-files

我安装的过程中提示了两个错误,一是没找到gcc,二是没找到make
在这里插入图片描述

用以下命令安装即可

sudo apt install gcc
sudo apt install make

安装过程中提示需不需要32-bit的xxx,那个我选了NO,另一个好像是X的自动更新,我选择了Yes。
标准的应该怎么选我也不知道

#安装成功
nvidia-smi #查看显卡信息

请添加图片描述

4.4 显卡的各种依赖配置

我们的目的是安装pytorch,并用gpu跑动

conda activate xxx #进入自己的环境
pip install torch torchvision torchaudio #此时pip会根据你的python版本去下一个合适的pytorch

然而,它不仅会下在pytorch还会下载cuda,根据我的显卡信息我需要的是cuda=12.2

未完

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值