File模块:
打开和创建文件
f=h5py.File('myfile.hdf5', 'r')
HDF5和其他Python文件对象差不多,支持r/w/a的操作,在不使用时需要关闭。
r | 只读,文件必须存在 |
---|---|
r+ | 读和写, 文件必须存在 |
w | 创建文件, |
w-或者x | 创建文件,如果存在则失败 |
a | 读和写如果文件存在,否则创建文件(默认) |
Datasets
Datasets非常类似Numpy的矩阵。不同于numpy,它支持不同的透明存储功能,例如压缩,错误检测和分块I / O
使用Group.create_dataset()或Group.require_dataset()创建新的数据集。 应该使用组索引语法(dset = group [“ name”])检索现有数据集。
要创建一个空的数据集,要做的就是指定一个名称,形状以及可选的数据类型(默认为’f’):
dset = f.create_dataset("default", (100,))
dset = f.create_dataset("ints", (100,), dtype='i8')
也可以将dataset初始化为Numpy的矩阵
arr = np.arange(100)
dset = f.create_dataset("init", data=arr)
shape和dtype可以同数据一起指定;如果这样做,他会覆盖数据之前的shape和dtype.
有以下要求
1).shape的总数要与数据的大小匹配
2).可以将数据的dtype转换为所要求的dtype