[python学习笔记] - python下csv,feather,parquet,jay,pickle的读写性能及空间占用测试

pandas下读写文件性能测试

测试目标类型,csv,parquet,feather,jay,pickle
使用package:pandas,dash,datatable
pandas使用单cpu读取,dash使用所有cpu读取。
耗时数据仅做量级参考,具体数值存在随机误差。

测试环境

cpu: AMD 3700x 8核16线程
RAM:64G 3200MHz
测试目标数据文件:
csv格式,2.75GB,27181814行,15列

固态硬盘

磁盘信息:pice3.0 nvme read:2200MB/s write:1700MB/s

数据类型空间占用耗时-write耗时-read耗时-read-dt耗时-read-dash
csv2.75GB145.01s28.08s1.67s0.01s
parquet0.71GB14.37s4.39s-0.03s
feather1.10GB5.32s3.66s--
jay3.37GB24.16s9.94s0.0006s-
pickle(gzip)2.82GB4.86s3.34s--

机械硬盘

磁盘信息:HDD 2TB 7200R read:176MB/s write:176MB/s

数据类型空间占用耗时-write耗时-read耗时-read-dt
csv2.75GB145.87s28.35s1.65s
parquet0.71GB14.55s4.39s-
feather1.10GB5.36s3.63s-
jay3.37GB53.51s9.50s0.0005s
pickle(gzip)2.82GB17.93s3.53s-

Python Dataframe之excel、csv、pickle、feather、parquet、jay、hdf5 文件存储格式==》存读效率对比
Speed up a pandas query 10x with these 6 Dask DataFrame tricks

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值