1.从数据集中导入Dataset
from torch.utils.data import Dataset
help(Dataset)
from PIL import Image #导入图片包
img_path = "E:\\datdasetpy\\hymenoptera_data\\train\\ants\\0013035.jpg" #图片路径
img = Image.open(img_path) #打开图片路径
#img.show() #显示图片
import os
dir_path = "E:\\datdasetpy\\hymenoptera_data\\train\\ants" #获取文件夹地址
img_path_list = os.listdir(dir_path) #获取文件夹里每个图片的列表
img.show(img_path_list[0]) #获取列表中第0个图片
root_dir = "dataset/train"
label_dir = "ants"
path = os.path.join(root_dir,label_dir) #把两个路径连接在一起
class MyData(Dataset):
def __init__(self,root_dir,label_dir): #当作全局变量在后面进行调用
self.root_dir = root_dir
self.label_dir = label_dir
self.path = os.path.join(self.root_dir,self.label_dir)
#获得所有图片的一个地址
self.img_path = os.listdir(self.path)
def __getitem__(self,idx): #1.通过索引idx获取图片的地址,先要获取所有图片的列表
img_name = self.img_path[idx]
img_item_path = os.path.join(self.root_dir,self.label_dir,img_name)
img = Image.open(img_item_path)
label = self.label_dir
return img,label
def __len__(self):
return len(self.img_path)
#获取蚂蚁的数据集,蜜蜂的数据集
ants_label_dir = "ants"
bees_label_dir = "bees"
ants_dataset = MyData(root_dir,ants_label_dir)
bees_dataset = MyData(root_dir,bees_label_dir)
# img,label = ants_dataset[0] #获取所有图片中索引为0,1的图片
# img.show()
# img,label = ants_dataset[1]
# img.show()
# img,label = bees_dataset[1]
# img.show()
#一整个数据集
train_dataset = ants_dataset + bees_dataset
# print(len(train_dataset))#看一下整个数据集的长度
# print(len(ants_dataset)) #蚂蚁数据集124
# print(len(bees_dataset)) #苍蝇数据集121
img,label = train_dataset[123]#按道理来说应该是蚂蚁的最后一张图片
img.show()
img,label = train_dataset[124]#苍蝇图片的第一张
img.show()