python前n项和存为一个数组_python-将数组或DataFrame与其他信息一起保存在文件中...

python-将数组或DataFrame与其他信息一起保存在文件中

统计软件Stata允许将短文本片段保存在数据集中。 这可以使用NumPy和/或NumPy完成。

这对我来说是非常有价值的功能,因为它使我可以保存各种信息,从提醒和待办事项列表到有关我如何生成数据甚至特定变量的估算方法的信息。

我现在试图在Python 3.6中提出类似的功能。 到目前为止,我已经在网上查看并咨询了许多帖子,但是这些帖子并不能完全解决我想要做的事情。

一些参考文章包括:

在磁盘上保留numpy数组的最佳方法

将熊猫数据框保存到pickle和csv之间有什么区别?

在笔记本中上传大型csv文件以使用python熊猫的最快方法是什么?

如何查看npz文件中的数据对象内容?

对于小型NumPy阵列,我得出的结论是,函数NumPy和Pandas的组合可以在单个文件中充分存储所有相关信息。

例如:

a = np.array([[2,4],[6,8],[10,12]])

d = {"first": 1, "second": "two", "third": 3}

np.savez(whatever_name.npz, a=a, d=d)

data = np.load(whatever_name.npz)

arr = data['a']

dic = data['d'].tolist()

但是,问题仍然存在:

是否存在更好的方法来将其他信息潜在地合并到包含NumPy阵列或(大)Pandas DataFrame的文件中?

我特别想听听您可能对示例提出的任何建议的利弊。 依赖性越少越好。

6个解决方案

25 votes

有很多选择。 我将只讨论HDF5,因为我有使用这种格式的经验。

优点:便携式(可以在Python之外读取),本机压缩,内存不足功能,元数据支持。

缺点:依赖于单个低级C API,可能会将数据损坏为单个文件,删除数据不会自动减小大小。

以我的经验,为了提高性能和便携性,请避免使用h5py/lzf存储数字数据。 您可以改用h5py提供的直观界面。

存储数组

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值