Ray Tune相关API介绍

最新推荐文章于 2023-06-28 21:20:40 发布

xl.zhang

最新推荐文章于 2023-06-28 21:20:40 发布

阅读量3.3k

点赞数 1

分类专栏：【机器学习框架Ray】【机器学习框架Ray专栏讲解】文章标签： ray tune python 分布式系统 ray

本文链接：https://blog.csdn.net/u011254180/article/details/81175151

版权

本文介绍了Ray Tune的API，包括注册训练函数、创建实验、运行实验、使用各种调度器如HyperOptScheduler、MedianStoppingRule等，以及PopulationBasedTraining算法。还提到了可训练模型的抽象类和客户端与实验的交互方式。

摘要由CSDN通过智能技术生成

1. 注册可训练的函数或类

ray.tune.register_trainable(name, trainable)

参数：

name (str) - 注册的方法或函数名。
trainable (obj) - 函数或tune.Trainable类。函数必须采用(config, status_reporter)作为参数，并且在注册的过程中自动转换为类。

2. 构造experiment对象

ray.tune.Experiment(name, run, stop=None, config=None, trial_resources=None, repeat=1, local_dir=None, upload_dir='', checkpoint_freq=0, max_failures=3)

参数：

name (str) – 名字。
run (str) – 要训练的算法或模型。这可以指内置算法的名称（例如RLLib的DQN或PPO），或者在tune注册表中注册的用户定义的可训练函数或类。
stop (dict) - 停止标准。值可以是TrainingResult中的任何字段，以先到达者为准。默认为空字典。
config (dict) – 特定于算法的配置（例如env，hyperparams）。默认为空字典。
trial_resources (dict) – 每次试验分配的机器资源，例如： {"cpu"：64，"gpu"：8}。请注意，除非您在此处指定GPU，否则不会分配GPU。默认为1个CPU和0个GPU。
repeat (int) – 重复每次试验的次数。默认为1。
local_dir (str) – 将训练结果保存到的本地目录。默认为〜/ ray_results。
upload_dir (str) – 同步训练结果的可选URI地址（例如s3：// bucket）。
checkpoint_freq (int) – 设置检查点间的训练迭代次数。值0（默认值）禁用设置检查点。
max_failures (int) – 设置尝试从最后一个检查点恢复试验的最多次数。仅在启用了检查点时适用。默认为3。

3. 运行实验程序</

最低0.47元/天解锁文章

xl.zhang

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Ray Tune相关API介绍

1. 注册可训练的函数或类ray.tune.register_trainable(name, trainable)参数： name (str) - 注册的方法或函数名。 trainable (obj) - 函数或tune.Trainable类。函数必须采用(config, status_reporter)作为参数，并且在注册的过程中自动转换为类。 2. 构造ex...
复制链接

扫一扫

专栏目录