HDF5数据库和mysql数据库_hdf5文件格式使用攻略

最新推荐文章于 2025-05-23 16:56:52 发布

原创最新推荐文章于 2025-05-23 16:56:52 发布 · 1.1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#HDF5数据库和mysql数据库

本文介绍了HDF5文件格式，包括其结构、Group和Dataset的概念，并通过Python的h5py库展示了创建、读取、追加内容以及删除数据集的操作。HDF5文件提供了一种高效的数据存储解决方案，适用于大型科学数据管理。

hdf5文件格式使用记录

引言

hdf5文件结构

python中使用h5py使用hdf5文件

参考链接

引言

最近，在使用gprMax进行仿真时发现gprMax在进行创建目标的可以从hdf5文件导入对象。而且我发现其实gpeMax的out其实也是hdf5文件格式，但是我竟然不知道hdf5文件是啥东西,有必要系统的了解一下。

hdf5文件结构

HDF5 文件一般以 .h5 或者 .hdf5 作为后缀名，需要专门的软件才能打开预览文件的内容。HDF5 文件结构中有 2 primary objects: Groups 和 Datasets。

Groups 就类似于文件夹，每个 HDF5 文件其实就是根目录 (root) group’/’。

Datasets 类似于 NumPy 中的数组 array 。

+-- /

| +-- group_1

| | +-- dataset_1_1

| | | +-- attribute_1_1_1

| | | +-- attribute_1_1_2

| | | +-- ...

| | |

| | +-- dataset_1_2

| | | +-- attribute_1_2_1

| | | +-- attribute_1_2_2

| | | +-- ...

|

整个hdf5文件如上图所示，可以看到group类似我们所熟知的文件夹，dataset就类似于一个numpy中的的array。

每个 dataset 可以分成两部分: 原始数据 (raw) data values 和元数据 metadata (a set of data that describes and gives information about other data => raw data)。

+-- Dataset

| +-- (Raw) Data Values (eg: a 4 x 5 x 6 matrix)

| +-- Metadata

| | +-- Dataspace (eg: Rank = 3, Dimensions = {4, 5, 6})

| | +-- Datatype (eg: Integer)

| | +-- Properties (eg: Chuncked, Compressed)

| | +-- Attributes (eg: attr1 = 32.4, attr2 = "hello", ...)

|

从上面的结构中可以看出：

Dataspace 给出原始数据的秩 (Rank) 和维度 (dimension)

Datatype 给出数据类型

Properties 说明该 dataset 的分块储存以及压缩情况

Attributes 为该 dataset 的其他自定义属性

python中使用h5py使用hdf5文件

首先安装h5py包，使用　pip install h5py

１.创建一个hdf5文件

#创建一个测试的hdf5文件

import h5py

import numpy as np

f = h5py.File("h5py_exaple.hdf5",'w')

#在该文件下建立一个group

g1 = f.create_group("gro1")

#在g1 group 下建立一个dataset

g1.create_dataset("data1",np.arange(10),np.int16))

g1.reate_dataset("d2",np.arange(10),np.int16))

g1.reate_dataset("d3",np.arange(10),np.int16))

print([key for key in g1.keys()])

#output: ['d2', 'd3', 'data1']

f.close()

2.读hdf5文件

import numpy as np

import h5py

f = h5py.File("h5py_exaple.hdf5","r")

print(f.filename)

#output: h5py_exaple.hdf5

print([key for key in f.keys()])

#output: ['gro1']

print([key for key in f['gro1'].keys()])

#output: ['d2', 'd3', 'data1']

３．追加内容

import numpy as np

import h5py

f = h5py.File("h5py_exaple.hdf5","a")

f.create_group('gro2')

print([key for key in f.keys()])

#output: ['gro1','gro2']

4.删除hdf5文件中的某一个数据集(必须以’w’或者’a’模式打开)

import h5py

with h5py.File("h5py_exaple.hdf5","a") as f:

del f['gro1/data1']

print([key for key in f['gro1'].keys()])

#output ['d2','d3']

参考链接

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。