.pkl文件_轻如“鸿毛(Feather)”的文件格式却重于泰山

前言

数据分析常用的数据格式无非就是json,txt,csv,excel 或者是数据库文件,他们各有所长。其中用处最广泛的应属于csv,因为它轻量,占用的空间相比于excel会小很多。它的可读性也不错,相比于txt 更适合数据分析,尤其是基于pandas的数据分析。

今天我们推荐一个日常中,小众但是很实用的文件格式 --Feather,一句话定位它​:高速读写压缩二进制文件​。​

Feather 介绍

Feather 其实是Apache Arrow 项目中包含的一种数据格式,但是由于其优异的性能,该文件格式也被单独打包,放在pip中进行安装。Pandas 也支持对Feather的读写,所以只需安装pandas即可。

官方介绍Feather是一款高速,轻量,易于使用的二进制文件格式,用于保存数据。它在设计时尽可能让API函数简单,而且优化了读写速度。

官方链接:Feather File Format

Pandas保存Feather 格式

秉承Feather的设计原则,Pandas 对于Feather的读写也保持API函数极简。Pandas 中写Feather 只有一个函数:

DataFrame.to_feather(**kwargs)

参数主要的有三个:

  • path: 需要保存的Feather文件路径
  • compression: 是否压缩,以及如何压缩,支持{'zstd', 'uncompr
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值