python多进程反而慢_python 3.6 多进程的坑

最新推荐文章于 2024-07-31 07:00:17 发布

weixin_39625337

最新推荐文章于 2024-07-31 07:00:17 发布

阅读量7.8k

点赞数 4

文章标签： python多进程反而慢

python 慢是事实，但是你如果想让他快，使用cpython 也可以，但是前提在你不使用第三方包的情况下，你要用了numpy pandas ，cython 就无法使用了，那只有使用python的多线程多进程协程来解决

都知道 python 有 GIL全局锁，所以多线程是鸡肋，只有多进程才可以利用上多核cpu ，当你启动你的程序打开 htop 看到多个核都跑满了飚绿色 100% 了就是成功用上了python的多进程，线程是进程的子集，协程是介于线程和进程的

在使用python的多进程有很多坑，使用多进程如果不用异步就是阻塞了，如果代码写的不同，就又阻塞了。

创建进程池 Pool，然后使用 apply_sync()方法实现异步

注意了 apply_sync()里的参数书写非常有讲究，不然就错了，就滑出去了，不执行，要么就是阻塞执行，

apply_sync(func= ,args=(,)), func 就是你要调用的方法，args就是放你调用方法的参数列表，实参， [func=]这五个字符不可以省略，生了，就不执行了，【args=】这五个字符也不可以省略，而且 args= 后跟的小括号里末尾必须跟一个逗号【，】否则还是阻塞执行，

如果你被调用的方法有返回值，必须使用 for 推导迭代式获取每个方法的 result.get()，不然就又变阻塞了，阻塞的一个表现就是只能使用跑满一个cpu 核核量，其他核就一直闲置，

import multiprocessing

from multiprocessing import Pool,cpu_count

from multiprocessing import Queue

from multiprocessing import Lock

from multiprocessing import Pipe

import logging

import numpy as np

import pandas as pd

multiprocessing.freeze_support()

pool=Pool(processes=self.cpus)

sub_dir_list=[]

logger.info("parrel_iter_image")

for sub_dir in range(0,10):

sub_root = self.image_root_dir + str(sub_dir) + '/'

sub_dir_list.append(sub_root)

logger.info(len(sub_dir_list))

result=[res.get() for res in [ pool.apply_async(func=self.iter_image,args=(sub_dir,)) for sub_dir in sub_dir_list]]

self.real_face= result

results = [res.get() for res in

[propool.apply_async(func=self._sub_df_etl, args=(df, field, out_field, use_stopword,)) for

index, df in enumerate(df_list)]]

weixin_39625337

关注

4
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。