【使用POOL进行并行运算反而变得奇慢无比】

凸眼小怪兽

已于 2022-09-09 09:59:18 修改

阅读量1.1k

点赞数

文章标签： python ubuntu 负载均衡

于 2022-09-09 09:55:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzzijian/article/details/126776760

版权

项目场景：

`使用python想要通过pool方法并行计算提高速度,结果速度反而变得奇慢无比。32个CPU并行没有2个CPU一个进程一个进程算的快。

问题描述

with mp.Pool(CPU_CORE) as pool:
run_results_a: List[Tuple[Optional[str], Any]] = pool.map_async(run_trader_wrap_error, configs_a).get()
run_results_b: List[Tuple[Optional[str], Any]] = pool.map_async(run_trader_wrap_error, configs_b).get()
pool.close()
pool.join()

代码看起来是正常的并行代码，结果速度却很慢。

原因分析：

pool给其中的每一个进程都分配一个CPU，但是这里面的进程可能自己又生成好多子进程。
在我的代码里，pool中每一个进程都会运行一个LGBM训练模型，但每一个LGBM本身也会多进程。导致htop看到后台的进程数量远远超过CPU的数量。CPU的计算资源都消耗在这些进程之间的通信了。

解决方案：

将调用的LGBM模型的参数设为{n_jobs= 1}，限定每个模型只绑定1个CPU。
然后后台就没有那么多进程了，运行速度变成了正常的并行速度。运行时间从预估的几天几夜变成了十几二十几分钟。

凸眼小怪兽

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。