如何使用服务器训练AI模型

最新推荐文章于 2024-10-01 17:54:24 发布

肆十二

最新推荐文章于 2024-10-01 17:54:24 发布

阅读量1.1k

点赞数 19

分类专栏：大作业系列文章标签：服务器人工智能运维

本文链接：https://blog.csdn.net/echoson/article/details/142530120

版权

大作业系列专栏收录该内容

27 篇文章 62 订阅

订阅专栏

如何使用服务器训练模型

大家好，这里是肆十二，之前有小伙伴反馈说自己的电脑只有cpu，没有GPU，也想要体验一下使用gpu训练模型，或者有的小伙伴反馈说自己所在的实验室提供了linux的服务器，但是不怎么会用，本期我们就来说说如何使用服务器来训练自己的模型。

获取服务器

如果你的实验室有服务器，那你就直接使用你们实验室的服务器即可，一般实验室的老师会提供给你服务器的IP地址、用户名以及密码这些信息，记住这些信息，后面我们将会使用到。

如果你没有服务器，你可以从网上租服务器，这些服务器有的是按照小时计费，有的是按照包年包月计费。具体哪里的好用大家可以去多查一些资料，基本流程都是一致的，你的最终目的都是为了得到这个服务器的ip、用户名以及密码，这里我就以我自己常用的网站为例进行说明。

登录网站之后，你可以根据你的自身情况来挑选合适的显卡，注意这里是按照小时进行计费的，大家要根据自己的经济水平来进行选择，另外，这个网站应该是可以进行学生认证的，认证之后应该有对应的优惠，如果小伙伴感兴趣的话可以认证一哈。点击上面的按钮选择之后，这里要进行对应镜像的选择，考虑到大家可能在服务器上进行多个环境的配置，这里记得选择conda，后面我们可以使用conda来创建不同的虚拟环境以适应不同的项目。

创建成功之后你将会再容器实例中查看到你的服务器。

记住下面这个位置的内容，他包含了你服务器的ip地址、端口号以及密码，后面我们链接的时候将会使用到。

访问服务器

之后就是访问服务器了，访问服务器的话这里推荐大家使用的工具是mobaxterm。

下载地址在这个位置：MobaXterm Xserver with SSH, telnet, RDP, VNC and X11 - Home Edition (mobatek.net)

大家下载这个版本即可，这个版本下载下来之后是一个压缩包，解压之后点击exe即可运行，非常方便。

ok，首先我们还是先从我们的autodl上获取到我们服务器的信息

ssh -p 44638 root@connect.cqa1.seetacloud.com

abcxdfdsaf

启动mobaxterm，新建一个会话。

输入你的用户名和密码，这个时候即可登录。注意，密码输入的时候是不会显示的，不是你键盘坏了，是他本来也就是不显示的。

登录成功之后会出现类似于上图这样的信息，其中上面红色的方框是你经常来执行的目录，这个目录下有比较大的空间。

上传文件到服务器上

在上传文件之前，我先和你大概说下他的界面上的内容有什么，其中左侧是文件浏览器，在这个文件浏览器下你可以看到服务器上有的文件，中间这个黑框就是命令行了，和我们之前教程中使用的cmd是一个道理。

我们上传文件在左侧进行上传即可，注意上传之前请保证你所处的目录尽量在一个空间比较大的目录下面。

我们进行示范的文件是我们行人检测那期栏目中的文件，其他的文件基本也是一致的，一般在项目目录下都会有一个readme的文件，你使用readme中的向导进行配置即可。

在服务器上配置环境

一般在服务器上有几个常用的命令，比如unzip是解压，cd是打开目录，pwd是查看目录，cat是查看文件。

在服务器上配置环境的过程和之前在cmd中配置环境的过程是一致的。

配置加速

conda config --remove-key channels
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --set show_channel_urls yes
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

创建和激活虚拟环境

conda create -n yolo python==3.8.5
conda activate yolo

安装torch

conda install pytorch==1.8.0 torchvision torchaudio cudatoolkit=10.2 # 注意这条命令指定Pytorch的版本和cuda的版本
conda install pytorch==1.10.0 torchvision torchaudio cudatoolkit=11.3 # 30系列以上显卡gpu版本pytorch安装指令
conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cpuonly # CPU的小伙伴直接执行这条命令即可