教你如何将Pandas迭代速度加快150倍?

本文介绍了如何优化Pandas在处理数据时的迭代速度,对比了iterrows()和itertuples()两种方法,通过实例展示itertuples()能将速度提升约154倍,对于大规模数据处理能显著节省时间。
摘要由CSDN通过智能技术生成

全文共1455字,预计学习时长5分钟

来源:Pexels

 

面对现实吧,Python的速度在与C语言或Go语言相比时,的确引发了不少口水战。

 

这让笔者一段时间以来,一直对Python快速处理任务的能力有所怀疑。

 

目前,笔者尝试在Go语言中进行数据科学研究——这是有可能的——但操作起来根本不像在Python中那样令人愉快,多半是由于语言的静态特性和数据科学大多是探索性领域。

 

并不是说用Go语言重写完成的解决方案不能提高性能,但这是另一篇文章的主题。

 

迄今为止,笔者至少忽略了Python可以更快地处理任务这一能力。笔者一直饱受目光短浅之苦——这是一种表现为当你只看到一种解决方案时,完全忽视其他方案的存在的综合征。相信出现这种情况的不只笔者自己。

 

这就是笔者今天想简要介绍如何令Pandas每日工作速度更快且更为愉悦的原因。更准确地说,该示例将关注行之间的迭代,并在过程中执行一些数据操作。因此,事不宜迟,一起进入正题。

 

来源:Pexels

 

做一个数据集

 

把观点论述清楚最简单的方法是声明一个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值