csv转为矩阵 python_Python单机查询1.5亿行数据秒出

7bb9760a64b078315d71788ec9a5d7bf.png

昨天介绍了Why DuckDB,今天就用它来体验在Python下1.5亿行数据的查询。

数据

最早知道 AirOnTime87to12 是学Sparklyr的时候看到一篇文章,使用Sparklyr导入30GB数据[1],具体文章内容,有兴趣的自己看,这里就不展开了。

AirOnTime87to12是一份航线准点率( On-time performance,OTP)的压缩包:

  • 303 个CSV,大小30G

  • 148617414 行数据,29个变量

  • Zip压缩包4.2G

  • 2013年8月由transtats.bts.gov提供下载

  • 转为snappy压缩的parquet 2.4G

硬件环境

  • OS:MacOS  10.15.6 (19G2021)

  • CPU:2.8 GHz Quad-Core Intel Core i7

  • MEM:16 GB 1600 MHz DDR3

  • HD:1T SSD

Python

  • Python 3.7

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值