简介
在深度学习中,hdf5格式的文件相比于其他读取方式,速度、内存占用和压缩程度都更强
hdf5 文件能够存储两种类型的数据对象:数据集(dataset),组(group)
- dataset 可以类比为数组:和numpy的数组差不多
- group可以类比为字典:有键(key)和值(value)。group中可以存放dataset或者其他的group。”键”就是组成员的名称,”值”就是组成员对象本身(组或者数据集)。
文件的读写
#读文件
import h5py
f=h5py.File("test.hdf5","r")
#写文件
import h5py
f=h5py.File("test.hdf5","w")
dataset 数据集的创建
import h5py
f=h5py.File("test.hdf5","w")
#dataset1是数据集的name,(20,)代表数据集的shape,i代表的是数据集的元素类型(int)
d1=f.create_dataset("dataset1", (20,), 'i')
现在给d1赋值:
#赋值
d1[..