在无外网服务器中搭建深度学习项目环境

badsniper

已于 2022-09-23 17:40:45 修改

阅读量1.2k

点赞数 2

分类专栏：深度学习环境配置文章标签：服务器深度学习 linux

于 2022-09-23 16:36:57 首次发布

本文链接：https://blog.csdn.net/qq_26536263/article/details/126848456

版权

背景介绍

各位实践于深度学习中的小伙伴们可能都被配置深度学习环境这一基础工作狠狠滴教育过。但是在无外网的服务器中配置项目运行环境可以用变态来形容了（可以想象一下不使用 pip install / conda install 来配环境）。前一阵项目组申请到几台双V100服务器（Centos 7.4）用于组内算法工程师的学习与测试，就是没有外网，所以基本上就是处于闲置状态。但是强大的算力摆在咱们面前，为了跑一些好玩的AI项目，说啥也得硬着头皮上了。

本地Conda环境准备

环境移植一般分为两种，在不同平台上的移植需要列出项目环境的 requirments.txt ，然后在服务器上根据 requirments.txt 去下载安装到对应环境中。但是对于无外网环境下，就需要自己去搜集对应平台的安装包了。这个工作很难，因为一个包可能会有很多依赖并不在requirments里。另一种在相同平台上的方法，我们只需要将环境打包，安装到服务器上就可以使用了。但是，要移植的环境所在的系统一定要与服务器的系统版本一致，这样才能最大程度保证移植后的环境可用。想要获得与服务器版本一致的系统有两种办法，一种是在你现有的电脑装双系统，另一种是使用虚拟机，选择哪种就看个人喜好了。虚拟机更简单方便，但是缺点也很致命，无法调用GPU。如果你已经按照项目的requirments在Win或Linux系统中配置过环境，且成功调用GPU并运行了程序。那么你一般就可以按照同样的方式直接在虚拟机里配置环境，在虚拟机中运行测试时忽略GPU就可以了。

虚拟机我使用的是Oracle VM VirtualBox，免费并且很轻量。虚拟机的安装使用我就不介绍了，大家自己搜索吧。