pytorch加载数据

Pytorch导入数据主要依靠torch.utils.data.DataLoader和torch.utils.data.Dataset这两个类来完成。
Dataset获取数据及其标签以及数据数量。
Dataloader:为后面的网络提供不同的数据形式。
加载自己数据过程
1.先重写Dataset。要有三个函数。分别是_ init getitem _ len_ _。
先定义一个类,再重写函数

from torch.utils.data import Dataset
import os
class MyData(Dataset):#然后重写三个函数
     def __init__(self,root):#root图片路径,根据路径得到数据列表
     	 imgs=os.listdir(root)
     	 self.imgs=[os.path.join(root,k) for k in imgs]
	def __len__(self):
        return len(self.imgs) #返回列表长度
    def __getitem__(self, index):#根据index找到对应图片并打开
		 img_path = self.imgs[index]
 		 pil_img = Image.open(img_path)
 		 pil_img = np.asarray(pil_img)
   		data = torch.from_numpy(pil_img)
  		return data
       
if __name__ == '__main__':
	trian_dataset=MyData('test')
 	print(dataSet[0])        

2.使用DataLoader迭代数据主要实现以下功能:

  1. 批处理数据(Batching the data)
  2. 打乱数据(Shuffling the data)
  3. 使用多线程 multiprocessing 并行加载数据,默认单线程
train_loader = dataloader.DataLoader(
  dataset=train_dataset,
  batch_size=128, # batch_size可以理解每次加载一个包,每个包中含有128张图片
  shuffle=False,
)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值