〇.引言
本文揉杂网上各种信息(几乎无原创性),再根据自己遇到的各种突发状况,做出一个整合。
一.前言
新到实验室,组里没有现成的服务器配置,拿到一个素主机,遂开始配置自己的深度学习工作站。本人的办公电脑为Macbook pro,目的是使用远程ssh连接服务器跑代码,并且做到SFTP,目前没有使用图形界面的需要。
二.硬件介绍
戴尔Precision 7920塔式工作站3090版
- CPU:Intel Xeon Sliver 4214R
- 内存:三星DDR4 32GBx2
- 显卡:RTX3090 24G
- 硬盘:固态 三星512G 机械 东芝2T
远程平台
Macbook pro
- Termius连接服务器
- Vscode编辑代码并在服务器运行
三.安装Linux系统
3.1 下载iso镜像
Ubuntu 20.04.6 LTS(Focal Fossa),下载Desktop image版本
3.2 制作系统盘
选择一个空U盘,容量大于4G即可
下载UltraISO->打开软件-启动-写入硬盘映像->将刚才下载好的Ubuntu写入至U盘中
至此U盘变成系统盘
3.3 安装
重启电脑->开机按del或者F12->进入Ubuntu->选择Install->一直下一步使用默认配置
至此电脑中安装Ubuntu成功
四、配置
4.1 换清华源
为提升下载包的速度,如果不是有很好的vpn,建议要替换源
4.2 下载miniconda
日常使用中,不同的模型很有可能使用不同版本的python和包运行,使用miniconda进行环境管理可以提升工作效率
#去官网下载miniconda
https://docs.conda.io/en/latest/miniconda.html
#第二步安装
cd到下载的目录然后使用bash下载
bash Miniconda3-py39_4.9.2-Linux-x86_64.sh
#第三步 更改清华源
source ~/.bashrc
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda
conda config --set show_channel_urls yes
创建个环境,下几个包
conda create -n cv python=3.8 #创建一个名称为cv的环境,默认下载python3.8
#下载各种包,这里使用pip和conda下载都是一样的,看哪个资源好速度快就用哪个
pip install opencv-python
conda install numpy
#常用命令
#查看已有环境
conda info --env
#查看已有安装包
conda list
#退出环境
conda deactivate
#删除某个环境
conda remove -n 环境名 --all
#删除某个环境下的某个包
conda remove -n 环境名 包名
4.3 安装nvidia显卡驱动
这里仅提及英伟达的显卡驱动
nvidia-smi #查看显卡是否驱动
#若未驱动,则需要安装驱动
https://www.nvidia.cn/geforce/drivers/ #下载显卡驱动,文件格式为.run
4.3.1 禁用nouveau
#禁用nouveau
sudo vim /etc/modprobe.d/blacklist.conf
#找到键盘上的Insert,在最后一行嵌入
blacklist nouveau
#Esc后输入
:wq或:wq!
#保存修改,Ctrl+z退出
#执行关闭命令
sudo update-initramfs -u
#重启电脑,手动重启或执行命令
sudo reboot now
#检查是否禁用成功,输入
lsmod | grep nouveau. #若无输出代表禁用成功
4.3.2 安装nvidia
#cd到文件夹下安装nvidia
sudo chmod a+x NVIDIA-Linux-*******.run
sudo sh ./NVIDIA-Linux-*******.run -no-opengl-files
我安装的过程中提示了两个错误,一是没找到gcc,二是没找到make
用以下命令安装即可
sudo apt install gcc
sudo apt install make
安装过程中提示需不需要32-bit的xxx,那个我选了NO,另一个好像是X的自动更新,我选择了Yes。
标准的应该怎么选我也不知道
#安装成功
nvidia-smi #查看显卡信息
4.4 显卡的各种依赖配置
我们的目的是安装pytorch,并用gpu跑动
conda activate xxx #进入自己的环境
pip install torch torchvision torchaudio #此时pip会根据你的python版本去下一个合适的pytorch
然而,它不仅会下在pytorch还会下载cuda,根据我的显卡信息我需要的是cuda=12.2
未完