本文将为您描述python3_h2py_hdf5_遍历_查看文件结构,教程操作步骤:python3_h2py_hdf5_遍历_查看文件结构
转载注明来源: 本文链接 来自osnosn的博客,写于 2020-03-26.
pandas 的 hdf5 支持函数,好像没办法把 HDF5 文件的结构列出来。
只好使用 h5py,把HDF5文件的结构打印出来。输出的是文本信息
python 3.6, 以下都是用 pip3 install 安装的
h5py 2.10.0 (h5py的文档)
numpy 1.18.2
pandas 1.0.3 (hdf5 的支持, 需要安装 tables)
tables 3.6.1 (PyTables' documentation)
方法1:
#!/usr/bin/python3
# -- coding:utf8 --
fname='myfilename.hdf5'
import h5py
def prt(name):
print(name)
f = h5py.File(fname,'r')
f.visit(prt)
f.close()
方法2:
#!/usr/bin/python3
# -- coding:utf8 --
fname='myfilename.hdf5'
import h5py
import numpy as np
def h5list(f,tab):
print(tab,'Group:',f.name,'len:%d'%len(f))
mysp2=tab[:-1]+ ' |-*'
for vv in f.attrs.keys(): # 打印属性
print(mysp2,end=' ')
print('%s = %s'% (vv,f.attrs[vv]))
mysp=tab[:-1] + ' |-'
for k in f.keys():
d = f[k]
if isinstance(d,h5py.Group):
h5list(d,mysp)
elif isinstance(d,h5py.Dataset):
print(mysp,'Dataset:',d.name,'(size:%d)'%d.size)
mysp1=mysp[:-1]+ ' |-'
print(mysp11,'(dtype=%s)'%d.dtype)
if d.dtype.names is not None:
print(mysp,end=' ')
for vv in d.dtype.names:
print(vv,end=',')
print()
mysp2=mysp1[:-1]+ ' |-*'
for vv in d.attrs.keys(): # 打印属性
print(mysp2,end=' ')
try:
print('%s = %s'% (vv,d.attrs[vv]))
except TypeError as e:
print('%s = %s'% (vv,e))
except:
print('%s = ?? Other ERR'% (vv,))
#print(d[:12]) # 打印12组数据看看
else:
print('??->',d,'Unkown Object!')
f = h5py.File(fname,'r')
h5list(f,'')
f.close()
pandas.HDFStore 的部分笔记
HDFStore 可以保存Series,DataFrame。
保存格式 fixed,不能添加(append),只能覆盖(重写)
保存格式 table,可以添加(append),可以覆盖(重写)
HDFStore 打开mode='w'时。会truncate文件,从零开始。
HDFStore 打开mode='a'时。为修改模式。
用put覆盖fixed表(内容不变),文件也会增大。增大的比table表多。
用put覆盖table表(内容不变),文件也会增大。增大的比fixed表少。
HDFStore 读出属性(attrs) hdf=pandas.HDFStore('xxx.hdf5','r') 以下任意一款都能用。
aa=hdf.root.group2._v_attrs.MyAttr
aa=hdf.get_node('/group2')._v_attrs.MyAttr
aa=hdf.get_node('/group2')._v_attrs['MyAttr']
HDFStore 写入属性(attrs) hdf=pandas.HDFStore('xxx.hdf5','w') 以下任意一款都能用。
hdf.root.group2._v_attrs.MyAttr='中文文字'
hdf.get_node('/group2')._v_attrs.MyAttr=u'中文文字'
hdf.get_node('/group2')._v_attrs['MyAttr']='english text'
HDFStore 的属性(attrs), 支持保存 list, tuple, class object, str, int
bool 保存到 attrs 中是 Bitfield, h5py读不出.
属性可以加在任意一层GROUP上,也可以加在root('/')上。
属性的读取/写入在pandas-1.0.3,tables-3.6.1 测试过。
pandas.HDFStore 的文档写的很不详细。
转载注明来源: 本文链接 来自osnosn的博客.python3_h2py_hdf5_遍历_查看文件结构就为您介绍到这里,感谢您关注懒咪学编程c.lanmit.com.
本文地址:https://c.lanmit.com/bianchengkaifa/Python/43587.html