Flowers102花分类的数据下载和处理

lanmy_dl

已于 2023-05-30 17:04:25 修改

阅读量1.5k

点赞数 2

分类专栏：数据文章标签：分类 python numpy

于 2023-05-28 18:00:38 首次发布

原文链接：https://github.com/gaoli1537/flower102

版权

数据专栏收录该内容

13 篇文章 0 订阅

订阅专栏

本来找到了一个别人准备好的网盘文件，结果一对发现少了图片，张数没对上，最终还是自己处理吧

数据下载

https://www.robots.ox.ac.uk/~vgg/data/flowers/102/

在这里插入图片描述
下载145，对于1可以使用迅雷下载，快的不是一点！！

下载后解压，解压可以看到是102flowers的文件夹，下面有一个jpg文件，里面全是散的图片

在这里插入图片描述

数据分类

# encoding:utf-8

import scipy.io

import numpy as np

import os

from PIL import Image

import shutil

labels = scipy.io.loadmat(r'E:\Base_code\test\Flower102\data\imagelabels.mat')#该地址为imagelabels.mat的绝对地址

labels = np.array(labels['labels'][0]) - 1

print("labels:", labels)

setid = scipy.io.loadmat(r'E:\Base_code\test\Flower102\data\setid.mat')#该地址为setid.mat的绝对地址

validation = np.array(setid['valid'][0]) - 1

np.random.shuffle(validation)

train = np.array(setid['trnid'][0]) - 1

np.random.shuffle(train)

test = np.array(setid['tstid'][0]) - 1

np.random.shuffle(test)

flower_dir = list()

for img in os.listdir(r"E:\Base_code\test\Flower102\102flowers\jpg"):#该地址为源数据图片的绝对地址
    flower_dir.append(os.path.join(r"E:\Base_code\test\Flower102\102flowers\jpg", img))

flower_dir.sort()

# print(flower_dir)

des_folder_train = r"E:\Base_code\test\Flower102\prepare_pic\train"#该地址为新建的训练数据集文件夹的绝对地址

for tid in train:

    #打开图片并获取标签

    img = Image.open(flower_dir[tid])

    print(img)

    # print(flower_dir[tid])

    img = img.resize((256, 256), Image.ANTIALIAS)

    lable = labels[tid]

    # print(lable)

    path = flower_dir[tid]

    print("path:", path)

    base_path = os.path.basename(path)

    print("base_path:", base_path)

    classes = "c" + str(lable)

    class_path = os.path.join(des_folder_train, classes)

    # 判断结果

    if not os.path.exists(class_path):

        os.makedirs(class_path)

    print("class_path:", class_path)

    despath = os.path.join(class_path, base_path)

    print("despath:", despath)

    img.save(despath)

des_folder_validation = r"E:\Base_code\test\Flower102\prepare_pic\val"#该地址为新建的验证数据集文件夹的绝对地址

for tid in validation:

    img = Image.open(flower_dir[tid])

    # print(flower_dir[tid])

    img = img.resize((256, 256), Image.ANTIALIAS)

    lable = labels[tid]

    # print(lable)

    path = flower_dir[tid]

    print("path:", path)

    base_path = os.path.basename(path)

    print("base_path:", base_path)

    classes = "c" + str(lable)

    class_path = os.path.join(des_folder_validation, classes)

    # 判断结果

    if not os.path.exists(class_path):

        os.makedirs(class_path)

    print("class_path:", class_path)

    despath = os.path.join(class_path, base_path)

    print("despath:", despath)

    img.save(despath)

des_folder_test = r"E:\Base_code\test\Flower102\prepare_pic\test"#该地址为新建的测试数据集文件夹的绝对地址

for tid in test:

    img = Image.open(flower_dir[tid])

    # print(flower_dir[tid])

    img = img.resize((256, 256), Image.ANTIALIAS)

    lable = labels[tid]

    # print(lable)

    path = flower_dir[tid]

    print("path:", path)

    base_path = os.path.basename(path)

    print("base_path:", base_path)

    classes = "c" + str(lable)

    class_path = os.path.join(des_folder_test, classes)

    # 判断结果

    if not os.path.exists(class_path):

        os.makedirs(class_path)

    print("class_path:", class_path)

    despath = os.path.join(class_path, base_path)

    print("despath:", despath)

    img.save(despath)