读取和保存zarr文件

最新推荐文章于 2024-07-27 19:20:47 发布

深山里的小白羊

最新推荐文章于 2024-07-27 19:20:47 发布

阅读量4.2k

点赞数 2

分类专栏：日用小技能文章标签： python zarr

本文链接：https://blog.csdn.net/qq_33757398/article/details/117932518

版权

日用小技能专栏收录该内容

73 篇文章 11 订阅

订阅专栏

Zarr是一种类似于hdf的数据格式，以文件夹形式存储，每个子文件夹代表一个dataset。它采用分块保存数据，便于处理大型3D医学图像。.zarray和.zattrs文件分别存储数据属性和元数据。读取和保存Zarr数据可通过zarr库实现，支持压缩和自定义数据特性。

摘要由CSDN通过智能技术生成

前言

zarr一种数据格式，和hdf文件有点类似，即一个文件里面可以包含很多不同的dataset
与hdf文件不同，直观上看hdf是一个单一的文件，而zarr是一个文件夹，里面还包含不同的子文件夹（相当于hdf中的dataset），子文件夹下面保存着数据
另一点，zarr分块保存数据，直白来讲，就是将一整块的数据划分成相同大小的子块，每个子块保存成一个文件，命名为*.*.*，这样处理的好处是对于大规模的医学图像非常友好
在这里插入图片描述

还有两个特殊的文件是.zarray和.zattrs，里面分别保存着数据特性和大小信息等等，例如
.zarray
在这里插入图片描述
.zattrs

读取

import zarr
import numpy as np
input_name = 'data.zarr'
dataset_name = 'volumes/raw'
f = zarr.open(input_name)
raw = f[dataset_name ]
print(raw.shape)
raw_data = raw[:]

保存

import zarr
import numpy as np
output_name = 'data.zarr'
dataset_name = 'volumes/raw'
root = zarr.open(output_name , mode='a')
shape = [1000, 1000, 1000] # 整个数据的大小，3D
chunk_size = [128, 128, 128] # 分块的大小
dtype = np.uint8 # 数据类型
compressor = {'id': 'gzip', 'level': 5}
compressor = zarr.get_codec(compressor) # 压缩方式
dataset_name = dataset_name.lstrip('/')
ds = root.create_dataset(
         dataset_name,
         shape=shape,
         chunks=chunk_size,
         dtype=dtype,
         compressor=compressor)
ds.attrs['resolution'] = [8, 8, 8]
ds.attrs['offset'] = [0, 0, 0]
ds[:] = np.ones(tuple(shape), dtype=dtype)