取代Python多进程!伯克利开源分布式框架Ray

\u003cblockquote\u003e\n\u003cp\u003eRay由伯克利开源,是一个用于并行计算和分布式Python开发的开源项目。本文将介绍如何使用Ray轻松构建可从笔记本电脑扩展到大型集群的应用程序。\u003c/p\u003e\n\u003c/blockquote\u003e\n\u003cp\u003e并行和分布式计算是现代应用程序的主要内容。我们需要利用多个核心或多台机器来加速应用程序或大规模运行它们。网络爬虫和搜索所使用的基础设施并不是在某人笔记本电脑上运行的单线程程序,而是相互通信和交互的服务的集合。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c6cc37a0551f.png\" alt=\"image\" /\u003e\u003c/p\u003e\n\u003cp\u003e云计算承诺在所有维度上(内存、计算、存储等)实现无限的可扩展性。实现这一承诺需要新的工具进行云编程和构建分布式应用程序。\u003c/p\u003e\n\u003ch2\u003e为什么要使用Ray?\u003c/h2\u003e\n\u003cp\u003e很多教程解释了如何使用Python的多进程模块(\u003ca href=\"https://docs.python.org/2/library/multiprocessing.html\"\u003ehttps://docs.python.org/2/library/multiprocessing.html\u003c/a\u003e)。遗憾的是,多进程模块在处理现代应用程序的要求方面存在严重的短板。这些要求包括以下这些内容:\u003c/p\u003e\n\u003cul\u003e\n\u003cli\u003e\n\u003cp\u003e在多台计算机上运行相同的代码。\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e构建有状态且可以与之通信的微服务和actor。\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e优雅地处理机器故障。\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e有效处理大对象和数值数据。\u003c/p\u003e\n\u003c/li\u003e\n\u003c/ul\u003e\n\u003cp\u003eRay(\u003ca href=\"https://github.com/ray-project/ray\"\u003ehttps://github.com/ray-project/ray\u003c/a\u003e)解决了所有这些问题,在保持简单性的同时让复杂的行为成为可能。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c6cc378aaf67.png\" alt=\"image\" /\u003e\u003c/p\u003e\n\u003ch2\u003e必要的概念\u003c/h2\u003e\n\u003cp\u003e传统编程依赖于两个核心概念:函数和类。使用这些构建块就可以构建出无数的应用程序。\u003c/p\u003e\n\u003cp\u003e但是,当我们将应用程序迁移到分布式环境时,这些概念通常会发生变化。\u003c/p\u003e\n\u003cp\u003e一方面,OpenMPI、Python多进程和ZeroMQ等工具提供了用于发送和接收消息的低级原语。这些工具非常强大,但它们提供了不同的抽象,因此要使用它们就必须从头开始重写单线程应用程序。\u003c/p\u003e\n\u003cp\u003e另一方面,我们也有一些特定领域的工具,例如用于模型训练的TensorFlow、用于数据处理且支持SQL的Spark,以及用于流式处理的Flink。这些工具提供了更高级别的抽象,如神经网络、数据集和流。但是,因为它们与用于串行编程的抽象不同,所以要使用它们也必须从头开始重写应用程序。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c6cc37be7efe.png\" alt=\"image\" /\u003e\u003cbr /\u003e\n用于分布式计算的工具\u003c/p\u003e\n\u003cp\u003eRay占据了一个独特的中间地带。它并没有引入新的概念,而是采用了函数和类的概念,并将它们转换为分布式的任务和actor。Ray可以在不做出重大修改的情况下对串行应用程序进行并行化。\u003c/p\u003e\n\u003ch2\u003e开始使用Ray\u003c/h2\u003e\n\u003cp\u003eray.init()命令将启动所有相关的Ray进程。在切换到集群时,这是唯一需要更改的行(我们需要传入集群地址)。这些过程包括:\u003c/p\u003e\n\u003cul\u003e\n\u003cli\u003e\n\u003cp\u003e有很多worker进程并行执行Python函数(大概是每个CPU核心对应一个worker)。\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e用于将“任务”分配给worker(以及其他计算机)的调度程序进程。任务是Ray调度的工作单元,对应于一个函数调用或方法调用。\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e共享内存对象存储库,用于在worker之间有效地共享对象(无需创建副本)。\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e内存数据库,用于存储在发生机器故障时重新运行任务所需的元数据。\u003c/p\u003e\n\u003c/li\u003e\n\u003c/ul\u003e\n\u003cp\u003eRay worker是独立的进程,而不是线程,因为在Python中存在全局解释器锁,所以对多线程的支持非常有限。\u003c/p\u003e\n\u003ch2\u003e并行任务\u003c/h2\u003e\n\u003cp\u003e要将Python函数f转换为一个“远程函数”(可以远程和异步执行的函数),可以使用@ray.remote装饰器来声明这个函数。然后函数调用f.remote()将立即返回一个future(future是对最终输出的引用),实际的函数执行将在后台进行(我们将这个函数执行称为任务)。\u003c/p\u003e\n\u003cpre\u003e\u003ccode\u003eimport ray\nimport time\n\n# Start Ray.\nray.init()\n\n@ray.remote\ndef f(x):\n    time.sleep(1)\n    return x\n\n# Start 4 tasks in parallel.\nresult_ids = []\nfor i in range(4):\n    result_ids.append(f.remote(i))\n    \n# Wait for the tasks to complete and retrieve the results.\n# With at least 4 cores, this will take 1 second.\nresults = ray.get(result_ids)  # [0, 1, 2, 3]\n\u003c/code\u003e\u003c/pre\u003e\n\u003cp\u003e在Python中运行并行任务的代码\u003c/p\u003e\n\u003cp\u003e因为对f.remote(i)的调用会立即返回,所以运行这行代码四次就可以并行执行f的四个副本。\u003c/p\u003e\n\u003ch3\u003e任务依赖\u003c/h3\u003e\n\u003cp\u003e一个任务还可以依赖于其他任务。在下面的代码中,multiply_matrices任务依赖两个create_matrix任务的输出,因此在执行前两个任务之前它不会先执行。前两个任务的输出将自动作为参数传给第三个任务,future将被替换为相应的值。通过这种方式,任务可以按照任意的DAG依赖关系组合在一起。\u003c/p\u003e\n\u003cpre\u003e\u003ccode\u003eimport numpy as np\n\n@ray.remote\ndef create_matrix(size):\n    return np.random.normal(size=size)\n\n@ray.remote\ndef multiply_matrices(x, y):\n    return np.dot(x, y)\n\nx_id = create_matrix.remote([1000, 1000])\ny_id = create_matrix.remote([1000, 1000])\nz_id = multiply_matrices.remote(x_id, y_id)\n\n# Get the results.\nz = ray.get(z_id)\n\u003c/code\u003e\u003c/pre\u003e\n\u003cp\u003e这里有三个任务,其中第三个任务依赖前两个任务的输出\u003c/p\u003e\n\u003ch3\u003e有效地对值进行聚合\u003c/h3\u003e\n\u003cp\u003e我们可以以更复杂的方式使用任务依赖。例如,假设我们希望将8个值聚合在一起。在我们的示例中,我们将进行整数加法,但在很多应用程序中,跨多台计算机聚合大型向量可能会造成性能瓶颈。在这个时候,只要修改一行代码就可以将聚合的运行时间从线性降为对数级别,即聚合值的数量。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c6cc3795934e.png\" alt=\"image\" title=\"左侧的依赖图深度为7,右侧的依赖图深度为3。计算产生相同的结果,但右侧的依赖图执行得更快。\" /\u003e\u003c/p\u003e\n\u003ccenter\u003e左侧的依赖图深度为7,右侧的依赖图深度为3。计算产生相同的结果,但右侧的依赖图执行得更快。\u003c/center\u003e\n\u003cp\u003e如上所述,要将一个任务的输出作为输入提供给后续任务,只需将第一个任务返回的future作为参数传给第二个任务。Ray的调度程序会自动考虑任务依赖关系。在第一个任务完成之前不会执行第二个任务,第一个任务的输出将自动被发送给执行第二个任务的机器。\u003c/p\u003e\n\u003cpre\u003e\u003ccode\u003eimport time\n\n@ray.remote\ndef add(x, y):\n    time.sleep(1)\n    return x + y\n\n# Aggregate the values slowly. This approach takes O(n) where n is the\n# number of values being aggregated. In this case, 7 seconds.\nid1 = add.remote(1, 2)\nid2 = add.remote(id1, 3)\nid3 = add.remote(id2, 4)\nid4 = add.remote(id3, 5)\nid5 = add.remote(id4, 6)\nid6 = add.remote(id5, 7)\nid7 = add.remote(id6, 8)\nresult = ray.get(id7)\n\n# Aggregate the values in a tree-structured pattern. This approach\n# takes O(log(n)). In this case, 3 seconds.\nid1 = add.remote(1, 2)\nid2 = add.remote(3, 4)\nid3 = add.remote(5, 6)\nid4 = add.remote(7, 8)\nid5 = add.remote(id1, id2)\nid6 = add.remote(id3, id4)\nid7 = add.remote(id5, id6)\nresult = ray.get(id7)\n\u003c/code\u003e\u003c/pre\u003e\n\u003cp\u003e以线性方式聚合值与以树形结构方式聚合值的对比\u003c/p\u003e\n\u003cp\u003e上面的代码非常清晰,但请注意,这两种方法都可以使用while循环来实现,这种方式更为简洁。\u003c/p\u003e\n\u003cpre\u003e\u003ccode\u003e# Slow approach.\nvalues = [1, 2, 3, 4, 5, 6, 7, 8]\nwhile len(values) \u0026gt; 1:\n    values = [add.remote(values[0], values[1])] + values[2:]\nresult = ray.get(values[0])\n\n# Fast approach.\nvalues = [1, 2, 3, 4, 5, 6, 7, 8]\nwhile len(values) \u0026gt; 1:\n    values = values[2:] + [add.remote(values[0], values[1])]\nresult = ray.get(values[0])\n\u003c/code\u003e\u003c/pre\u003e\n\u003cp\u003e更简洁的聚合实现方案。两个代码块之间的唯一区别是“add.remote”的输出是放在列表的前面还是后面。\u003c/p\u003e\n\u003ch2\u003e从类到actor\u003c/h2\u003e\n\u003cp\u003e在不使用类的情况下开发有趣的应用程序很具挑战性,在分布式环境中也是如此。\u003c/p\u003e\n\u003cp\u003e你可以使用@ray.remote装饰器声明一个Python类。在实例化类时,Ray会创建一个新的“actor”,这是一个运行在集群中并持有类对象副本的进程。对这个actor的方法调用转变为在actor进程上运行的任务,并且可以访问和改变actor的状态。通过这种方式,可以在多个任务之间共享可变状态,这是远程函数无法做到的。\u003c/p\u003e\n\u003cp\u003e各个actor按顺序执行方法(每个方法都是原子方法),因此不存在竞态条件。可以通过创建多个actor来实现并行性。\u003c/p\u003e\n\u003cpre\u003e\u003ccode\u003e@ray.remote\nclass Counter(object):\n    def __init__(self):\n        self.x = 0\n    \n    def inc(self):\n        self.x += 1\n    \n    def get_value(self):\n        return self.x\n\n# Create an actor process.\nc = Counter.remote()\n\n# Check the actor's counter value.\nprint(ray.get(c.get_value.remote()))  # 0\n\n# Increment the counter twice and check the value again.\nc.inc.remote()\nc.inc.remote()\nprint(ray.get(c.get_value.remote()))  # 2\n\u003c/code\u003e\u003c/pre\u003e\n\u003cp\u003e将Python类实例化为actor\u003c/p\u003e\n\u003cp\u003e上面的例子是actor最简单的用法。Counter.remote()创建一个新的actor进程,它持有一个Counter对象副本。对c.get_value.remote()和c.inc.remote()的调用会在远程actor进程上执行任务并改变actor的状态。\u003c/p\u003e\n\u003ch3\u003eactor句柄\u003c/h3\u003e\n\u003cp\u003e在上面的示例中,我们只在主Python脚本中调用actor的方法。actor的一个最强大的地方在于我们可以将句柄传给它,让其他actor或其他任务都调用同一actor的方法。\u003c/p\u003e\n\u003cp\u003e以下示例创建了一个可以保存消息的actor。几个worker任务反复将消息推送给actor,主Python脚本定期读取消息。\u003c/p\u003e\n\u003cpre\u003e\u003ccode\u003eimport time\n\n@ray.remote\nclass MessageActor(object):\n    def __init__(self):\n        self.messages = []\n    \n    def add_message(self, message):\n        self.messages.append(message)\n    \n    def get_and_clear_messages(self):\n        messages = self.messages\n        self.messages = []\n        return messages\n\n# Define a remote function which loops around and pushes\n# messages to the actor.\n@ray.remote\ndef worker(message_actor, j):\n    for i in range(100):\n        time.sleep(1)\n        message_actor.add_message.remote(\n            \u0026quot;Message {} from actor {}.\u0026quot;.format(i, j))\n\n# Create a message actor.\nmessage_actor = MessageActor.remote()\n\n# Start 3 tasks that push messages to the actor.\n[worker.remote(message_actor, j) for j in range(3)]\n\n# Periodically get the messages and print them.\nfor _ in range(100):\n    new_messages = ray.get(message_actor.get_and_clear_messages.remote())\n    print(\u0026quot;New messages:\u0026quot;, new_messages)\n    time.sleep(1)\n\n# This script prints something like the following:\n# New messages: []\n# New messages: ['Message 0 from actor 1.', 'Message 0 from actor 0.']\n# New messages: ['Message 0 from actor 2.', 'Message 1 from actor 1.', 'Message 1 from actor 0.', 'Message 1 from actor 2.']\n# New messages: ['Message 2 from actor 1.', 'Message 2 from actor 0.', 'Message 2 from actor 2.']\n# New messages: ['Message 3 from actor 2.', 'Message 3 from actor 1.', 'Message 3 from actor 0.']\n# New messages: ['Message 4 from actor 2.', 'Message 4 from actor 0.', 'Message 4 from actor 1.']\n# New messages: ['Message 5 from actor 2.', 'Message 5 from actor 0.', 'Message 5 from actor 1.']\n\u003c/code\u003e\u003c/pre\u003e\n\u003cp\u003e在多个并发任务中调用actor的方法\u003c/p\u003e\n\u003cp\u003eactor非常强大。你可以通过它将Python类实例化为微服务,可以从其他actor和任务(甚至其他应用程序中)查询这个微服务。\u003c/p\u003e\n\u003cp\u003e任务和actor是Ray提供的核心抽象。这两个概念非常通用,可用于实现复杂的应用程序,包括用于\u003ca href=\"https://ray.readthedocs.io/en/latest/rllib.html\"\u003e强化学习\u003c/a\u003e、\u003ca href=\"https://ray.readthedocs.io/en/latest/tune.html\"\u003e超参数调整\u003c/a\u003e、\u003ca href=\"https://github.com/modin-project/modin\"\u003e加速Pandas\u003c/a\u003e等Ray内置库。\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e英文原文:\u003c/strong\u003e\u003c/p\u003e\n\u003cp\u003e\u003ca href=\"https://medium.com/@robertnishihara/modern-parallel-and-distributed-python-a-quick-tutorial-on-ray-99f8d70369b8\"\u003ehttps://medium.com/@robertnishihara/modern-parallel-and-distributed-python-a-quick-tutorial-on-ray-99f8d70369b8\u003c/a\u003e\u003c/p\u003e\n
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值