恒源云(Gpushare)_自动化训练小技巧白送给你,不要吗?

文章来源 | 恒源云社区

原文地址 | 自动化后台训练

作者 | Littleor


大噶好啊,今日小编还在坚挺中,没疯,虽然被告知所在区域是封控区,但工作还需要我去完成,我得加油!⛽️

今天先不搬运小伙伴们的论文类文章,先给各位来个技巧分享!
内容不长,希望能带给各位炼丹小伙伴们一点小小的帮助。

这里是一个简单易用的一个后台全自动化训练日志记录、结果数据自动保存和自动关机的脚本。
仓库地址:https://github.com/Littleor/HY-Auto-Trainer

特性

  • 使用 nohup 在后台进行训练,完全可以断开 ssh 的连接,解放双手。
  • 训练完成自动打包运行结果到 OSS 上,避免结果丢失。
  • 上传完成自动关机,省钱省事~

用法

配置

  • 复制目录下所有的 *.sh 文件到项目目录(如 /hy-tmp)
  • 给 *.sh 文件加上权限:
chmod a+x *.sh
  • 修改 run.sh 中的 logPath 来修改日志保存路径
  • 修改 end.sh 中的 resultPath 来修改需要保存的运行结果的路径
  • 如果非 Python 项目, 则需要修改 end.sh 的 python 为对应的执行命令即可

使用

以本项目为例,在项目中有个 Train/main.py 文件作为模拟训练的文件,并将项目文件放在 /hy-tmp 目录下。

运行方法:

# ./run.sh [可执行文件目录] [Tag 用于标注结果]
./run.sh /hy-tmp/Train/main.py Test-Trainer
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值