利用Azure云上的GPU Cluster来跑EfficientDet的注意事项

最新推荐文章于 2022-12-20 00:41:16 发布

水滴与鱼

最新推荐文章于 2022-12-20 00:41:16 发布

阅读量792

点赞数

分类专栏：笔记文章标签： azure 深度学习 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/garyaofq/article/details/122501378

版权

笔记专栏收录该内容

38 篇文章 1 订阅

订阅专栏

首先导入azureml.core

其次从azureml.core导入Environment,Experiment,ScriptRunConfig,Workspace

获取workspace

用Environment.form_conda_specification来获取运行环境，我在这里停留了很长时间，因为例子中用的是Environment.get(workspace=ws,name="AzureML-PyTorch-1.4-GPU").clone("mlflow-env"),env.Python.conda_dependencies.add_pip_package("azureml-mlflow"),env.Python.conda_dependencies.add_pip_package("pillow==6.0.0");无论如何修改，得到的环境和自己运行的环境都不一致，导致各种报错如不支持Cuda等。把name改为配置好的环境如AzureML-pytorch-1.9-ubuntu18.04-py37-cuda11-gpu,发现也有许多问题，如pytorch版本最高只到1.9，支持不到1.9.1，无法再添加packages.

用ScriptRunConfig来配置源文件夹和训练脚本

设置好脚本运行环境和目标机器（带GPU)

获取实验（如果没有，则创建）

提交实验

注意点：

安装包里要包含mlflow和azureml-mlflow
源文件夹里不要放大量数据，超出300M就麻烦了，但可以用azureml._restclient.snapshots_client.SNAPSHOT_MAX_SIZE_BYTES=zijieshu来加大限制，如果文件超过2000个，少放点，因为最少一个脚本文件就可以运行了

训练用coco数据用文件形式的dataset存储，读取，Azure上有现成的读取代码，直接用就可以了

在把训练放到Azure云上训练之前，要先在本地跑成功，本地训练注意：

如果你没有专业显卡，把gpus=1改为gpus=0(或Cuda=1改为Cuda=0)
工作空间的获取方式不一样，按官方教程设置
提交实验之前添加：mlflow.set_tracking_url(ws.get_mlflow_tracking_uri());mlflow.set_experiment(experiment_name)就可以在azure中的log中查看log刷新

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

水滴与鱼 CSDN认证博客专家 CSDN认证企业博客

码龄14年

46: 原创

19万+: 周排名

10万+: 总排名

3万+: 访问

: 等级

517: 积分

45: 粉丝

62: 获赞

16: 评论

112: 收藏

私信

关注

热门文章

分类专栏

笔记 38篇
Opengl 1篇

最新评论

JS加载AGV地图（二）
水滴与鱼: 搜下最新的“Canvas加载AGV地图”，里面有源码，一个html文件
JS画布内生成图标，并实现拖拽，连线，刷新
水滴与鱼: 连线的时候，要点在图标上，不行换个浏览器试下
JS画布内生成图标，并实现拖拽，连线，刷新
aliangrifeng: 我测试了一下一样的代码，但是连不了线
JS加载AGV地图（二）
龙猫＆*: 源码能分享吗
VSCODE下资源文件的使用
水滴与鱼: DOS下手动编译c++项目： g++.exe -Wall -fexceptions -finput-charset=GBK -g -finput-charset=UTF-8 -c C:\Projects\9.GLSL\GLSL_REV\main.cpp -o obj\Debug\main.o g++.exe -Wall -fexceptions -finput-charset=GBK -g -finput-charset=UTF-8 -c C:\Projects\9.GLSL\GLSL_REV\Sphere.cpp -o obj\Debug\Sphere.o windres.exe C:\Projects\9.GLSL\GLSL_REV\main.rc obj\Debug\res.o g++.exe -o bin\Debug\GLSL.EXE obj\Debug\main.o obj\Debug\Sphere.o obj\Debug\res.o -static-libstdc++ -static-libgcc -static -lgdi32 -luser32 -lkernel32 -lcomctl32 -lopengl32 -lglu32 -mwindows

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

水滴与鱼 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。