在集群是手动启动Ray

本文档详细阐述如何在集群中手动启动和停止Ray,适用于小型集群。首先,在选定的head节点上启动Ray,然后在其他节点上使用head节点的地址启动。启动时可以指定节点的CPU和GPU资源。接着提供了一个Python代码示例来测试Ray集群是否正常运行。最后,介绍了如何有序地停止Ray进程,强调了启动和停止的顺序注意事项。
摘要由CSDN通过智能技术生成

本篇主要介绍Ray在集群中的使用(启动及停止)并通过一个例子测试Ray是否启动成功(主要适应小型集群。对于较大集群可以考虑使用pass包:sudo apt-get install pssh私有集群的安装命令。)

在集群上部署Ray

假设有一个正在运行的集群,并且集群中的节点可以彼此通信,另外还假定Ray安装在每台机器上。

在每台机器上启动Ray

1.在head节点上(只需选择某个节点作为head节点)运行以下操作。如果省略了--redis-port参数,Ray将随机选择一个端口。

ray start --head --redis-port=6379

该命令将打印出启动的Redis服务器的地址(以及一些其他地址信息)。
**2.然后在所有其他节点上运行以下操作。**确保将<redis-address>替换为head节点上命令打印的值(例如:123.45.67.89:6379)。

ray start --redis-address=<redis-address>   

所有的子节点上运行的启动命令中的地址是相同的,即--redis-address=<redis-address> 是相同的 。

如果您希望指定一台机器有10个cpu和

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值