python效率numpy_Python数据处理性能对比,原生,Pandas,Numpy哪个更优秀

原标题:Python数据处理性能对比,原生,Pandas,Numpy哪个更优秀

今天为大家分享一个关于数据处理性能的对比,从原生,Pandas ,Numpy这三个方面对比?你觉得哪个更优秀呢?对于一个数据科学家来说,速度和时间是一个很至关重要的的因素

下图显示了我的实验结果(详情如下),与纯Python的处理速度做出对比。

de6b1da091a4422f94ef79195e4711fb.jpeg

如你所见,Numpy的表现比Pandas的表现要好几倍。我个人喜欢用Pandas来简化许多繁琐的数据科学任务,它是我的首选工具。但是如果预计的处理时间超过多个小时,那么很遗憾,我只能使用Numpy来替代Pandas。

我非常清楚实际的性能可能会有很大的不同,这取决于任务和处理类型。所以请把这些结果仅仅作为参考。没有任何一个单独的测试可以全面对比所有软件工具的性能。

简介

在下面的 Notebook 中你将会比较 Python 原生方法, Pandas 和 Numpy 处理数据的速度。

d33196fb64764387bc1c9ff16d054faa.jpeg

导入模块

1e73977f159a446e85687f6c9ab4ac0b.jpeg

制作模拟随机数据集

41fe9fdd13574cef883531f11bac4be1.jpeg

8d16b7b7ca4147a1b51e7a8973bb0f7c.jpeg

e1d13b03060b4e12be142fabccaa33dc.jpeg

Dataset size 54818 records

55a16f1821d74f26a31e3e874487dae2.jpeg

b5b8e2d4e96a46bb89d5343c980d28f4.jpeg

Python 原生方法

d99d6c2d26b64d1bae3a3b80ba115cc4.jpeg

Pandas 方法

e4f2a584dd86406cb3b49eb266ac9ce6.jpeg

Numpy 方法

699706cb9d704351a0143ba80ea1a918.jpeg

检查是否所有的方法生成同样的结果

69dad8a9379646bdae08dc7170b10eca.jpeg

比较运行时间

fcdfd8db9d6c48f09a3307faf8c09779.jpeg

Python average time: 38.77917420864105 seconds

Pandas average time: 10.483694124221802 seconds

90910530c05f4ec6a8b20f121a22c695.jpeg

Numpy average time: 2.914765810966492 seconds

展示结果

责任编辑:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值