python pandas 多进程 apply

最新推荐文章于 2024-01-16 14:55:56 发布

chrisplus

最新推荐文章于 2024-01-16 14:55:56 发布

阅读量1.4k

点赞数

分类专栏： Pandas Python 树莓派文章标签： python pandas 多线程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chrisplus/article/details/115486730

版权

本文介绍了如何使用pandarallel库来加速pandas的apply操作，通过示例展示了在32位树莓派系统上，处理RFM数据时，多进程apply相比于原生pandas apply的显著性能提升。

摘要由CSDN通过智能技术生成

今天介绍一个库,叫pandarallel,用于pandas库多进程执行.

安装库 pip install pandarallel

测试平台:

+ 32位树莓派系统 Pi OS

+ python 3.7

+ pandas 1.0.3

大致代码如下:

这是一段简单计算RFM的代码,由原生pandas apply完成

```

today = datetime.datetime.now() df = pd.read_csv('rfm.csv', parse_dates=['max_trandt']) bg = time.time() df['max_trandt'] = df['max_trandt'].apply(lambda dt: (today - dt).days) # print(df.head(100).to_string()) tran_count_m = df['tran_count'].median() max_trandt_m = df['max_trandt'].median() max_tranam_m = df['max_tranam'].median() df['r'] = df['max_trandt'].apply(lambda row: '0' if row - max_trandt_m >= 0 else '1') df['f'] = df['tran_count'].apply(lambda row:

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python pandas 多进程 apply

今天介绍一个库,叫pandarallel,用于pandas库多线程执行.安装库 pip install pandarallel测试平台:+ 32位树莓派系统 Pi OS+ python 3.7+ pandas 1.0.3大致代码如下:```# 这是一段简单计算RFM的代码today = datetime.datetime.now()df = pd.read_csv('rfm.csv', parse_dates=['max_trandt'])bg = time..
复制链接

扫一扫

专栏目录

chrisplus CSDN认证博客专家 CSDN认证企业博客

码龄17年

21: 原创

14万+: 周排名

128万+: 总排名

9万+: 访问

: 等级

936: 积分

12: 粉丝

23: 获赞

10: 评论

82: 收藏

私信

关注

热门文章

分类专栏

ffmpeg 1篇
Notepad++ 1篇
Pandas 3篇
MSSQL 5篇
Kettle 1篇
Golang
树莓派 6篇
Python 10篇

最新评论

提高Kettle的MySQL写入速度
是兰胖子呀: 没解决，已经不用了
树莓派4 Ubuntu 64位系统 7zip benchmark 跑分
nsynet_sky: 我的32位的跑5338，但是我的7zip版本和你的不同 Compressing | Decompressing Dict Speed Usage R/U Rating | Speed Usage R/U Rating KiB/s % MIPS MIPS | KiB/s % MIPS MIPS 22: 4002 333 1170 3894 | 79365 363 1865 6771 23: 3711 339 1116 3781 | 77910 364 1853 6741 24: 3640 342 1144 3914 | 81043 388 1833 7112 25: 3506 351 1142 4004 | 72867 358 1810 6485 ---------------------------------- | ------------------------------ Avr: 3715 341 1143 3898 | 77796 368 1840 6777 Tot: 355 1492 5338
提高Kettle的MySQL写入速度
Yej~: 大哥们有解决的嘛？
提高Kettle的MySQL写入速度
大圣数据星球: 老哥解决了吗
提高Kettle的MySQL写入速度
大圣数据星球: 我也是，刚才加了，还是没变

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。