H5文件读取

最新推荐文章于 2024-05-27 11:14:52 发布

神遁克里苏

最新推荐文章于 2024-05-27 11:14:52 发布

阅读量2k

点赞数 2

分类专栏： pytorch 笔记学习任务

本文链接：https://blog.csdn.net/zzy_pphz/article/details/112695598

版权

笔记同时被 3 个专栏收录

43 篇文章 1 订阅

订阅专栏

pytorch

17 篇文章 2 订阅

订阅专栏

学习任务

11 篇文章 1 订阅

订阅专栏

H5文件读取：

import torch.utils.data as data
import torch
import h5py

class DatasetFromHdf5(data.Dataset):
    def __init__(self, file_path):
        super(DatasetFromHdf5, self).__init__()
        hf = h5py.File(file_path)
        self.data = hf.get('data')
        self.target = hf.get('label')


    def __getitem__(self, index):
        return torch.from_numpy(self.data[index,:,:,:]).float(), torch.from_numpy(self.target[index,:,:,:]).float()


    def __len__(self):
        return self.data.shape[0]

调用的时候，先用DataLoader将数据装入 training_data_loader中

 train_set = DatasetFromHdf5(r"D:\PycharmProjects\pytorch-vdsr-master\data\train.h5")
 training_data_loader = DataLoader(dataset=train_set, num_workers=opt.threads, batch_size=opt.batchSize, shuffle=True)

在使用数据训练的时候写一个循环，iteration只是一个计数的，从1开始计数，表示已经取第iteration个批次了，batch就是每次取出一个批次的数值。

input和target是取出的输入和希望得到的输出，这里的返回顺序是在上边的DatasetFromHdf5中定义的。

 def __getitem__(self, index):
        return torch.from_numpy(self.data[index,:,:,:]).float(), torch.from_numpy(self.target[index,:,:,:]).float()

所以batch[0]表示input(也就是存储的data)，batch[1]表示label(也就是label)。
index在这里应该是每次按第一个维度取出data中的数值。data[index,:,:,:]，本来是维度是1000×1×41×41，每次取的是1×1×41×41。按照batch来，每次取出的就是batch×1×41×41

  for iteration, batch in enumerate(training_data_loader, 1):
        input, target = Variable(batch[0]), Variable(batch[1], requires_grad=False)

神遁克里苏

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录