yield python 两层_python multiprocess 使用 yield

这篇博客探讨了在处理大量数据时如何利用Python的Generator避免内存问题,并结合Multiprocessing实现并行处理。通过部分消费Generator和使用imap,可以减少内存占用并提高程序效率。示例代码展示了如何在多进程环境中有效利用Generator和imap进行数据处理。
摘要由CSDN通过智能技术生成

python在处理数据的时候,memory-heavy 的数据往往会导致程序没办反运行或者运行期间服务器其他程序效率受到影响。这种情况往往会把数据集合变为通过genertor来遍历。

但同时如我们所知,generoter看似只能被单进程消费,这样效率很低。

generator 可以被pool.map消费。

看一下pool.py的源码。

for i, task in enumerate(taskseq):

...

try:

put(task)

except IOError:

debug('could not put task on queue')

break

实际是先将generator全部消费掉放到queue中。然后通过map来并行。这样是解决了使用map来并行。

但是依然没有解决占用内存的问题。这里有两步占用内存。

第一步是全部消费掉的generator。

第二步并行运算全部data。

解决第一个问题,通过部分消费generator来达到。

解决第二个问题,可以通过imap来达到.

示例代码如下:

import multiprocessing as mp

import itertools

import time

def g():

for el in xrange(50):

print el

yield el

import os

def f(x):

time.sleep(1)

print str(os.getpid()) +" "+ str(x)

retu

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值