pandarallel 参数说明

网球小伙子

已于 2023-10-31 17:59:10 修改

阅读量1k

点赞数

文章标签： python pandas

于 2023-10-08 14:20:27 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/RogerFedereYY/article/details/133680901

版权

Pandarallel是一个Python库，用于并行运行Pandas中的apply、map和applymap函数，使得代码可以更快地运行。Pandarallel采用了Dask并行框架，可用于本地和远程计算。

Pandarallel的使用非常简单，只需要在需要并行运行的Pandas函数前使用parallel_apply()、parallel_map()或parallel_applymap()即可，例如：df.apply(...) --> df.parallel_apply(...)

以下讲解一下参数:
from pandarallel import pandarallel
pandarallel.initialize(）

shm_size_mb：Pandarallel共享内存的大小，以MB为单位。如果默认值太小，可以设置较大的一个。默认情况下，它设置为2 GB。（INT）
nb_workers：工人数量。默认情况下，它设置为数字，您的操作系统看到的核心数。（INT）
progress_bar：将其设置为“True”以显示进度条。
verbose：详细程度。 > 1显示所有日志 - 1，仅显示初始化日志 - <1显示无日志（int）

pandarallel.initialize(shm_size_mb=6072, nb_workers=11,progress_bar=False, verbose=0)

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。