使用 docker 搭建自己的实验环境——解决很多小伙伴论文复现环境搭建难题

smile-yan

已于 2022-10-31 09:34:52 修改

阅读量1w

点赞数 3

分类专栏：异常检测文章标签： docker 异常检测论文复现

于 2022-10-30 23:12:54 首次发布

本文链接：https://blog.csdn.net/smileyan9/article/details/127592804

版权

异常检测专栏收录该内容

28 篇文章 327 订阅

订阅专栏

1. 问题描述

对于论文复现，大多数小伙伴都会遇到很多很多各种各样的问题。尽管我已经尽力回答所有人的留言，甚至为一些小伙伴免费提供了我自己购买的云服务器，但是依然很难解决 “如何让这些代码在我本地运行” 的问题。经过多次尝试，以及其他小伙伴的帮助，我开始将很多实验都移到docker中进行，并且搭建好环境，完成实验以后，将镜像导出并开源，以供更多人使用。

当然，不得不说，我做的只是非常小的一部分工作，最主要的内容还是论文开源作者提供。

2. 方案描述

每次实验都是基于 docker 进行的操作，使用 anaconda3 的合适的版本，配置合适版本的 tensorflow 或者 pytorch，并且安装论文算法的依赖，并且添加论文使用到的数据集（如果数据集公开的话）完成论文实验。并且将 docker 环境导出，以供更多小伙伴的使用。

方案依赖：

需要具有一定的 docker 基础；
需要具有一定的 python 基础。

3. 实操例子

目前研究论文源码地址来自 https://github.com/NetManAIOps/OmniAnomaly ，现在需要搭建环境，运行这个代码。

3.1 检查 docker 是否安装完成

$ docker --version

在这里插入图片描述

3.2 下载 tensorflow 1.15 镜像

前往 tensorflow docker 镜像找到合适的版本镜像。我们这里选择的是低版本的，1.15.5，对应的链接为 https://hub.docker.com/r/tensorflow/tensorflow/tags?page=1&name=1.15 。

$ docker pull tensorflow/tensorflow:1.15.5-jupyter

pull 完成以后，查看镜像如下：

在这里插入图片描述

3.3 docker 本地启动 jupyter

为了方便我们新建一个文件夹专门存储 jupyter notebook，并在启动 docker 的时候指定路径，方便我们本地与docker镜像之间传输文件，保存环境等等。

我自己本地路径为 ~/smileyan/docker-notebooks/ ，也就是说启动 jupyter 的时候默认显示的 notebooks 对应的就是这个目录。

现在启动命令如下：

注意 需要根据自己的实际路径修改一下路径，并且根据自己喜好设置端口，这里使用的是 10086 端口。

$ docker run -it --rm -v $(realpath ~/smileyan/docker-notebooks):/tf/notebooks -p 10086:8888 tensorflow/tensorflow:1.15.5-jupyter

在这里插入图片描述

3.4 本地浏览器访问 10086 端口

第一次访问会要求输入token。

在这里插入图片描述

如上图所示，两个文件夹，其中 notebooks 就是我们前面启动镜像的时候配置的自己的本地路径，而 tensorflow-tutorials 是这个镜像自带的。感兴趣的自行查看。

这里我们在 notebooks 下新建一个 jupyter notebook ，并且输入以下代码，查看效果：

在这里插入图片描述
到目前为止我们确定已经搭建好了 python3,6 + tensorflow 1.15.5 的环境。

3.5 下载实验源码

在自己的本地浏览器上下载实验源码，然后移动到前面我们配置好了的 docker_notebooks 的文件夹下面，并解压。

在这里插入图片描述
接下来我们在刚刚解压的源码目录下新建一个 notebook，以方便运行源码。

3.6 安装 git

为了避免出现如下错误，得安装一下 git。
在这里插入图片描述

apt-get update

apt-install git

3.7 编辑 requirements.txt

去除用不上的比如 GPU 相关的，更改为不带 GPU 版本的，当然，对于拥有GPU的，而且驱动什么的都安装好了，需要根据自己情况调整。

更改版本不合理的，比如 matplotlib 和 six 。

更改完成以后，我们的 requirement.txt 如下：

six
matplotlib
numpy
pandas
scipy == 1.2.0
scikit_learn == 0.20.2
tensorflow == 1.12.0
tensorflow_probability == 0.5.0
tqdm
imageio
fs == 2.3.0
click == 7.0
git+https://github.com/thu-ml/zhusuan.git
git+https://github.com/haowen-xu/tfsnippet.git@v0.2.0-alpha1