Deep Snake本机环境配置:
1、系统环境一览:
显卡:RTX2060
驱动:NVIDIA-Linux-x86_64-440.82
CUDA:10.0
Cudnn:7.6.5
Python:3.7.9
Torch: 1.2.0
torchvision:0.4.0
其他的按照Github官网安装就好
关于DeepSnake训练coco数据集的方法,参照博客:Real-Time实例分割DeepSnake使用篇
2、输入下列命令复制当前虚拟环境:
cd /snake
conda activate snake
conda env export > environment.yaml
此时在snake文件夹下应该可以找到environment.yaml文件
3、给系统安装SSH服务
一般来说系统已经自己安装好了,若没有安装,参考博客进行安装
极链AI云平台训练:
1、上传snake代码
(1)在极链AI云平台上注册账号
(2)充钱
(3)用户中心->数据管理->我的文件->新建文件夹snake->上传snake代码,如下图所示:
2、创建实例
在共享市场中选一块显卡租赁,我这里选择的是RTX2080Ti,GPU数量为1,然后选择官方镜像进行配置,如下图所示:
(1)点击创建实例,等待系统分配资源
(2)系统资源分配成功之后,点击获取登录指令
(3)在本地打开终端,复制网址上的登录指令和密码进行远程连接
登录成功则如下图所示:
(4)找到刚才上传的snake压缩包
cd /data-user
ls
mkdir -p /data-input/snake
tar zxvf /data-user/snake/snake.tar.gz -C /data-tmp/snake/
#此时在/data-tmp/snake/snake下面就包含了项目文件夹
(5)配置环境
cd /data-tmp/snake/snake
pip install -r requirements.txt
(6)拷贝coco2017数据集到/data-tmp文件夹下
#安装文件拷贝工具
apt-get update
apt-get install rsync -y
#拷贝文件
rsync -ah --progress /data-share/Datasets/coco2017 /data-tmp
(7)将数据集中的压缩文件均解压出来
cd /data-tmp/coco2017
7z x train2017.zip
7z x test2017.zip
(8)为数据集创建软连接
ln -s /user-tmp/coco2017 /user-tmp/snake/snake/data/coco
(9)本地Pycharm通过SSH连接服务器
参考网址:PyCharm 远程连接
连接成功的话可以发现本地修改的代码可以实时上传到服务器端,非常方便,图下图所示:
(10)在本地Pycharm上修改dataset_catalog.py文件中的coco数据集路径,下面贴出一个,另外其他三个coco相关的参照此修改即可:
'CocoTrain': {
'id': 'coco',
'data_root': 'data/coco/coco2017/train2017',
'ann_file': 'data/coco/coco2017/annotations/instances_train2017.json',
'split': 'train'
},
(11)开始训练数据集
cd /data-tmp/snake/snake
python -W ignore train_net.py --cfg_file ./configs/coco_snake.yaml
如下图所示,说明已经成功可以训练了。