Pandas VS. Numpy 读取文件速度比较

最新推荐文章于 2024-05-12 15:20:43 发布

梧桐雪

最新推荐文章于 2024-05-12 15:20:43 发布

阅读量2.4k

点赞数 2

分类专栏： python高级数据处理方法

本文链接：https://blog.csdn.net/weixin_41855010/article/details/104288536

版权

python高级数据处理方法专栏收录该内容

80 篇文章 12 订阅

订阅专栏

准备了一个包含500多万条数据的txt文件，分别使用numpy的genfromtxt()方法和pandas的read_table()方法，对读取时间进行了计时，可以得出结论，在读取大量数据方面，panda比numpy要快一个数量级。
代码如下：

import numpy as np
import pandas as pd
import time

start_time = time.time()
data = np.genfromtxt('rating.txt',delimiter=',')
end_time = time.time()
print("Numpy reading time:"+str(round((end_time-start_time)*1000,2)))

start_time = time.time()
data = pd.read_table('rating.txt',delimiter=',')
end_time =time.time()
print("Pandas reading time:"+str(round((end_time-start_time)*1000,2)))

运行结果如下：

Numpy reading time:128914.37
Pandas reading time:8565.49
[Finished in 142.9s]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

梧桐雪

关注关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Pandas VS. Numpy 读取文件速度比较

准备了一个包含500多万条数据的txt文件，分别使用numpy的genfromtxt()方法和pandas的read_table()方法，对读取时间进行了计时，可以得出结论，在读取大量数据方面，panda比numpy要快一个数量级。代码如下：import numpy as npimport pandas as pdimport timestart_time = time.time()...
复制链接

扫一扫