python将数组保存至文件_Python 将数组(np.array)或DataFrame及相关属性保存到文件的方法...

1、使用numpy.savez()实现a = np.array([[2,4],[6,8],[10,12]])

d = {"first": 1, "second": "two", "third": 3}

np.savez(whatever_name.npz, a=a, d=d)

data = np.load(whatever_name.npz)

arr = data['a']

dic = data['d'].tolist()

2、使用h5py实现

相关文档:h5pyimport h5py, numpy as np

arr = np.random.randint(0, 10, (1000, 1000))

f = h5py.File('file.h5', 'w', libver='latest') # use 'latest' for performance

dset = f.create_dataset('array', shape=(1000, 1000), data=arr, chunks=(100, 100),

compression='gzip', compression_opts=9)

#添加一些属性

dset.attrs['Description'] = 'Some text snippet'

dset.attrs['RowIndexArray'] = np.arange(1000)

#储存字典

for k, v in d.items():

f.create_dataset('dictgroup/'+str(k), data=v)

#内存不足时访问方法

dictionary = f['dictgroup']

res = dictionary['my_key']

3、使用pyarrow实现

1) 安装引用pip install pyarrow

2) 实现代码import pyarrow as pa

import pyarrow.parquet as pq

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.normal(size=(1000, 10)))

tab = pa.Table.from_pandas(df)

tab = tab.replace_schema_metadata({'here' : 'it is'})

pq.write_table(tab, 'where_is_it.parq')

pq.read_table('where_is_it.parq')

相关文档:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值