python分布式进程

最新推荐文章于 2020-12-21 12:09:48 发布

u010660276

最新推荐文章于 2020-12-21 12:09:48 发布

阅读量701

点赞数 1

分类专栏： python

python 专栏收录该内容

27 篇文章 0 订阅

订阅专栏

转自：分布式进程
在Thread和Process中，应当优选Process，因为Process更稳定，而且，Process可以分布到多台机器上，而Thread最多只能分布到同一台机器的多个CPU上。

Python的multiprocessing模块不但支持多进程，其中managers子模块还支持把多进程分布到多台机器上。一个服务进程可以作为调度者，将任务分布到其他多个进程中，依靠网络通信。由于managers模块封装很好，不必了解网络通信的细节，就可以很容易地编写分布式多进程程序。

举个例子：如果我们已经有一个通过Queue通信的多进程程序在同一台机器上运行，现在，由于处理任务的进程任务繁重，希望把发送任务的进程和处理任务的进程分布到两台机器上。怎么用分布式进程实现？

原有的Queue可以继续使用，但是，通过managers模块把Queue通过网络暴露出去，就可以让其他机器的进程访问Queue了。

我们先看服务进程，服务进程负责启动Queue，把Queue注册到网络上，然后往Queue里面写入任务：
windows下：

__author__ = 'gaoqingjin'
import time,queue,random
from multiprocessing.managers import BaseManager
from multiprocessing import freeze_support
task_queue=queue.Queue()
result_queue=queue.Queue()
class QueueManager(BaseManager):
    pass
def return_task_queue():
    return task_queue
def return_result_queue():
    return result_queue
def test():
    QueueManager.register('get_task_queue',callable=return_task_queue)
    QueueManager.register('get_result_queue',callable=return_result_queue)
    manager=QueueManager(address=('127.0.0.1',5000),authkey=b'abc')
    manager.start()
    task=manager.get_task_queue()
    result=manager.get_result_queue()
    for i in range(10):
        n=random.randint(0,1000)
        print('Put task %d...' % n)
        task.put(n)
    print('Try get results.')
    for i in range(10):
        r=result.get(timeout=10)
        print('Result: %s' % r)
    manager.shutdown()
    print('master exit.')
if __name__=='__main__':
    freeze_support()
    test()

请注意，当我们在一台机器上写多进程程序时，创建的Queue可以直接拿来用，但是，在分布式多进程环境下，添加任务到Queue不可以直接对原始的task_queue进行操作，那样就绕过了QueueManager的封装，必须通过manager.get_task_queue()获得的Queue接口添加。

然后，在另一台机器上启动任务进程（本机上启动也可以）：

__author__ = 'gaoqingjin'
import time,sys,queue
from multiprocessing.managers import BaseManager
class QueueManager(BaseManager):
    pass

QueueManager.register('get_task_queue')
QueueManager.register('get_result_queue')

server_addr='127.0.0.1'
print('Connect to server %s...' % server_addr)

m=QueueManager(address=(server_addr,5000),authkey=b'abc')
m.connect()
task=m.get_task_queue()
result=m.get_result_queue()
for i in range(10):
    try:
        n=task.get(timeout=1)
        print('run task %d * %d...' % (n,n))
        r='%d * %d = %d' % (n,n,n*n)
        time.sleep(1)
        result.put(r)
    except queue.Empty:
        print('task queue is empty.')

print('worker exit.')