yield python 两层_python multiprocess 使用 yield

最新推荐文章于 2022-07-11 07:38:00 发布

weixin_39834149

最新推荐文章于 2022-07-11 07:38:00 发布

阅读量179

点赞数

文章标签： yield python 两层

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39834149/article/details/114010300

版权

这篇博客探讨了在处理大量数据时如何利用Python的Generator避免内存问题，并结合Multiprocessing实现并行处理。通过部分消费Generator和使用imap，可以减少内存占用并提高程序效率。示例代码展示了如何在多进程环境中有效利用Generator和imap进行数据处理。

摘要由CSDN通过智能技术生成

python在处理数据的时候，memory-heavy 的数据往往会导致程序没办反运行或者运行期间服务器其他程序效率受到影响。这种情况往往会把数据集合变为通过genertor来遍历。

但同时如我们所知，generoter看似只能被单进程消费，这样效率很低。

generator 可以被pool.map消费。

看一下pool.py的源码。

for i, task in enumerate(taskseq):

...

try:

put(task)

except IOError:

debug('could not put task on queue')

break

实际是先将generator全部消费掉放到queue中。然后通过map来并行。这样是解决了使用map来并行。

但是依然没有解决占用内存的问题。这里有两步占用内存。

第一步是全部消费掉的generator。

第二步并行运算全部data。

解决第一个问题，通过部分消费generator来达到。

解决第二个问题，可以通过imap来达到.

示例代码如下：

import multiprocessing as mp

import itertools

import time

def g():

for el in xrange(50):

print el

yield el

import os

def f(x):

time.sleep(1)

print str(os.getpid()) +" "+ str(x)

retu

最低0.47元/天解锁文章

weixin_39834149

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
yield python 两层_python multiprocess 使用 yield

python在处理数据的时候，memory-heavy 的数据往往会导致程序没办反运行或者运行期间服务器其他程序效率受到影响。这种情况往往会把数据集合变为通过genertor来遍历。但同时如我们所知，generoter看似只能被单进程消费，这样效率很低。generator 可以被pool.map消费。看一下pool.py的源码。for i, task in enumerate(taskseq):....
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。