Pytorch DataLoader 训练读取数据报错 h5py objects cannot be pickled

SJTUzhou

于 2024-05-20 23:00:25 发布

阅读量435

点赞数 7

分类专栏： pytorch 文章标签： pytorch 人工智能 python

本文链接：https://blog.csdn.net/SJTUzhou/article/details/139076549

版权

pytorch 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

问题描述

数据集为h5文件，文件较大无法全部读入内存，故使用自定义Dataset和DataLoader从硬盘中读取，再使用Pytorch训练模型。在多张GPU同时训练时，希望通过设置 DataLoader(..., num_workers=8, ...) 使用多进程读取数据，加速训练，但遇到报错 h5py objects cannot be pickled，后查询得知基本版h5py不支持多进程操作。

设置`num_workers=0`可以解决报错，但无法加速训练

有博主（https://blog.csdn.net/qq_36468195/article/details/114922648）建议设置 DataLoader(..., num_workers=0, ...) ，通过主线程读取数据，这样可以见解决报错，但无法提升训练速度，主进程在读取数据时会阻塞训练，使得训练时间延长。

解决方法

安装 h5pickle 模块

pip install h5pickle

在实例化Dataset中打开h5文件时，使用h5pickle模块替代h5py模块打开文件.

import torch
import h5py
import h5pickle

class MyDataset(torch.utils.data.Dataset):
    def __init__(self, h5_file, ...):
    	...
    	...
		# self.h5_file_handle = h5py.File(h5_file, "r")
		self.h5_file_handle = h5pickle.File(h5_file, "r")
		...
		...

具体请参考

https://github.com/DaanVanVugt/h5pickle

SJTUzhou

关注

7
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
Pytorch DataLoader 训练读取数据报错 h5py objects cannot be pickled

数据集为h5文件，文件较大无法全部读入内存，故使用自定义Dataset和DataLoader从硬盘中读取，再使用Pytorch训练模型。在多张GPU同时训练时，希望通过设置。使用多进程读取数据，加速训练，但遇到报错 h5py objects cannot be pickled。
复制链接

扫一扫