Ray Tune相关API介绍

本文介绍了Ray Tune的API,包括注册训练函数、创建实验、运行实验、使用各种调度器如HyperOptScheduler、MedianStoppingRule等,以及PopulationBasedTraining算法。还提到了可训练模型的抽象类和客户端与实验的交互方式。
摘要由CSDN通过智能技术生成

1. 注册可训练的函数或类

ray.tune.register_trainable(name, trainable)

参数:

  • name (str) - 注册的方法或函数名。

  • trainable (obj) - 函数或tune.Trainable类。函数必须采用(config, status_reporter)作为参数,并且在注册的过程中自动转换为类。

 

2. 构造experiment对象

ray.tune.Experiment(name, run, stop=None, config=None, trial_resources=None, repeat=1, local_dir=None, upload_dir='', checkpoint_freq=0, max_failures=3)

参数:

  • name (str) – 名字。

  • run (str) – 要训练的算法或模型。 这可以指内置算法的名称(例如RLLib的DQN或PPO),或者在tune注册表中注册的用户定义的可训练函数或类。

  • stop (dict) - 停止标准。 值可以是TrainingResult中的任何字段,以先到达者为准。 默认为空字典。

  • config (dict) – 特定于算法的配置(例如env,hyperparams)。 默认为空字典。

  • trial_resources (dict) – 每次试验分配的机器资源,例如: {"cpu":64,"gpu":8}。 请注意,除非您在此处指定GPU,否则不会分配GPU。 默认为1个CPU和0个GPU。

  • repeat (int) – 重复每次试验的次数。 默认为1。

  • local_dir (str) – 将训练结果保存到的本地目录。 默认为〜/ ray_results。

  • upload_dir (str) – 同步训练结果的可选URI地址(例如s3:// bucket)。

  • checkpoint_freq (int) – 设置检查点间的训练迭代次数。 值0(默认值)禁用设置检查点。

  • max_failures (int) – 设置尝试从最后一个检查点恢复试验的最多次数。 仅在启用了检查点时适用。 默认为3。

 

3. 运行实验程序</

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值