幻方萤火 | 一行代码，自动调参

幻方AI小编

已于 2022-10-10 14:32:43 修改

阅读量821

点赞数

分类专栏： hfai深度学习套件文章标签：人工智能 java 开发语言深度学习

于 2022-09-23 13:35:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_66945478/article/details/127008940

版权

幻方AI推出Autotune工具，简化深度学习调参过程。用户只需设定参数范围，该工具将在萤火集群上自动进行参数组合尝试，加速调参并统计模型性能。设计包括固定参数搜索和网格搜索两种模式，支持本地调试，并能整合训练结果。

摘要由CSDN通过智能技术生成

调参是深度学习中的必经过程，研究者们往往需要花费大量的时间进行调参，以获取最好效果的模型参数。对于参数规模不大的小模型，手工运行实验进行参数调优还是可以接受的方法，但当遇上大模型时，只凭人工进行参数优化就会变得难以实操，也难以高效利用GPU集群的强大算力。

为了解决这一问题，幻方 AI 基于萤火集群的特性，研发了一套辅助调参工具——Autotune。用户只需要设定好参数搜索范围，在幻方萤火集群上发起训练，Autotune 会自动帮您尝试所有的参数组合，合理分配算力进行测试，最后统计输出不同参数下的模型表现。

设计思路

hfai.autotune 旨在降低调参门槛，改动少部分代码即可实现自动调参。

萤火集群可以通过 hfai 命令或在 JupyterLab 中手动发起的方式来提交训练任务，然而这些方法并不能支持大批量的任务发起。因此在 Autotune 的设计中我们选择 create_experiment_v2 接口，实现一次提交多任务的目标。

用户在使用时设定需要测试的参数组或直接指定参数范围，Autotune 将需要调优的参数进行组合，然后进行网格搜索。这里需要创建多个可以同时训练的任务，在算力允许的范围内运行尽可能多的任务以加速调参过程。

不同任务的训练结果会集中记录在一个日志文件夹中，统计输出时会从这个文件夹中读取所有参数的结果，进行排序后返回。

任务发起

介绍完 hfai.autotune 的设计思路

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

幻方AI小编 CSDN认证博客专家 CSDN认证企业博客

码龄3年

42: 原创

117万+: 周排名

141万+: 总排名

6万+: 访问

: 等级

387: 积分

49: 粉丝

30: 获赞

9: 评论

303: 收藏

私信

关注

热门文章

分类专栏

最新评论

hfai venv | 运行环境的影分身术
SERE834: 请问有谁用wsl来使用这个集群的嘛，他只直说我驱动器版本太旧
模型实践｜ CLIP 模型
qq_40374634: 兄台，分布式那部分的rank初始化可是一点没漏出来啊
萤火跑模型 | 多卡并行助力 BEVFormer 三小时全精度训练
幻方AI小编: 我们使用的平台上是幻方萤火深度学习训练平台
萤火跑模型 | 多卡并行助力 BEVFormer 三小时全精度训练
北冰洋的咸鱼君: 请问大佬，您用来复现BEVFormer的平台环境是什么样的呀？我在尝试复现的时候总是因为，torch\cuda\mmdet\mmseg\mmdet3d这些版本冲突出问题，按照官方的版本来写也是。。。
模型实践 | Autoformer 长时序预测
Kinopio笨比小蓝: 您好，请教下，autoformer是分解嵌入到模型中，分解和预测交叉进行的，说是以前的先分解再预测会受限于分解效果，忽略了未来各组分之间的关系，可是我没有懂这句话的意思，想请您详细解释下可以嘛

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

幻方AI小编 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。