Ubuntu22.4.03服务器版安装及搭建深度学习环境的问题总结

Ubuntu22.4.03服务器版安装

流程

整个流程已经有很多分享帖了,这里概述一下:下载iso制作启动U盘,按f2进入安装,选择语言,键盘布局english,ubuntu server 安装,DHCP自动配置网络(问题1),代理服务器我们没填,配置阿里云镜源http://mirrors.aliyun.com/ubuntu/,磁盘分区(问题2),设置服务器密码,安装ssh远程工具,重启reboot。

可参考大佬文章:

问题

问题一

安装ubuntu必须插网线,我们当时插的网线连接校园网,在windows系统下每次开机都要输入账号密码,所以即使插着网线,安装Ubuntu时在配置镜源那一步就会报错,后来我们买了一个路由器让校园网网线接着路由器,我们再连着路由器就解决了,后期连接xshell的时候自己电脑必须连接这个网络才能和连着网线的主机连接。

问题二

在分区的时候,分了两个区,但是一个区特别小,没有充分利用空间,修改输入一个特别大的数保存会自动改成剩下最大的容量,但是后期会出问题,所以在这个数的基础上减1,就可以了。

下载xshell远程连接

我下载的是免费版https://www.xshell.com/zh/free-for-home-school/​​​​​​

也可以顺便下一个xftp,便于后期主机与服务器传文件,不下也行,xshell里自带xftp,连接教程还挺多的大家可以自行搜索,注意本机和服务器连接同一个网络

创建多用户,教程也挺多,注意别踩坑,我一开始创建好了两个用户,但是没有创建对应的目录,后来又是搜了好多教程补坑,大家注意避坑!

安装显卡驱动535

多用户安装一个即可,另一个用户也会有。

1.先把之前的nvidia驱动卸载干净:

sudo apt-get remove --purge nvidia*


2.执行以下命令:

sudo apt-get update


3.在终端里输入下面的命令查看可选择的驱动:

sudo ubuntu-drivers devices


4.下载你想下载的nvidia驱动版本:

sudo apt install nvidia-driver-535


5.重启电脑(这一步很重要,不重启没有效果):

reboot

以上方法参考大佬文章:参考链接

安装cuda11.8

在xshell中登录自己的账号,输入下面的命令

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
sudo sh cuda_11.8.0_520.61.05_linux.run

安装步骤这里省略了,(配置环境)安装好后输入sudo gedit ~/.bashrc,进入文件中,按Insert键,在最后一行输入(这里的环境变量我不太确定,大家可以看看别的教程)

$ export PATH=/usr/local/cuda-11.8/bin${PATH:+:${PATH}}
$ export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64\
                         ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

最后在英文下输入:wq保存退出,source ~/.bashrc更新环境变量,nvcc -V检查是否安装成功,多用户也只安装一个即可,另一个用户只要配置环境即可,同上。

安装cudnn8.7.0

一开始也是通过wget下载,但是后面解压的时候一直报错找不到文件,后来是在我电脑上下好通过xftp传到服务器。https://developer.nvidia.com/rdp/cudnn-archive

进行解压:

tar -xvf cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz

将解压的文件拷贝到cuda对应目录,进行cudnn的安装,这一步我跟着网上的教程老是报错,后来分现是路径的问题,我的用户文件夹地址是/home/chen,所以后来我改成

sudo cp /home/chen/cudnn-linux-x86_64-8.7.0.84_cuda11-archive/include/* /usr/local/cuda-11.8/include

才可以,这里只是举个例子,没有写完全部的命令,大家可以自行找教程再修改。

通过下面这个命令验证即可

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

安装anaconda2023-3-1

注意下面的步骤需要多用户分别去安装了!
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2023.03-1-Linux-x86_64.sh

这里参考的是大佬文章:参考

创建虚拟环境

conda create -n pytorch-gpu python=3.9

在这个环境中,一键配置
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

安装好啦,大家可以自行验证!
连接pycharm
这里也有很多教程,不过给大家提个醒,解释器要在自己账号目录下找,例如我的是/home/chen/anaconda3/envs/pytorch-gpu/bin/python
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值