分割分类数据集

最新推荐文章于 2024-07-21 11:18:01 发布

东哥爱编程

最新推荐文章于 2024-07-21 11:18:01 发布

阅读量93

点赞数

分类专栏：深度学习 ubuntu python 文章标签：分类人工智能数据挖掘

本文链接：https://blog.csdn.net/monk96/article/details/131726033

版权

python 同时被 3 个专栏收录

50 篇文章 2 订阅

订阅专栏

深度学习

31 篇文章 3 订阅

订阅专栏

ubuntu

11 篇文章 0 订阅

订阅专栏

分割分类数据集

# -*-coding: utf-8 -*-
import os
import random
import shutil

# 定义各个文件夹的路径
parent_folder = "./"
a_folder = os.path.join(parent_folder, "angry")
b_folder = os.path.join(parent_folder, "happy")
c_folder = os.path.join(parent_folder, "relaxed")
d_folder = os.path.join(parent_folder, "sad")

# 计算每个文件夹中要划分为验证集的图片数量
val_ratio = 0.1
a_val_size = int(val_ratio * len(os.listdir(a_folder)))
b_val_size = int(val_ratio * len(os.listdir(b_folder)))
c_val_size = int(val_ratio * len(os.listdir(c_folder))) 
d_val_size = int(val_ratio * len(os.listdir(d_folder)))

# 分别对每个文件夹进行处理，将图片移动到 train/ 和 val/ 目录中
train_folder = os.path.join(parent_folder, "train")
val_folder = os.path.join(parent_folder, "val")
os.makedirs(train_folder, exist_ok=True)
os.makedirs(val_folder, exist_ok=True)
for folder in [a_folder, b_folder, c_folder, d_folder]:
    filenames = os.listdir(folder)
    random.shuffle(filenames)  # 打乱文件顺序
    val_filenames = set(filenames[:a_val_size])
    train_filenames = set(filenames[a_val_size:])

    # 移动文件到 train/ 或 val/ 目录中的子文件夹中
    for filename in train_filenames:
        src_path = os.path.join(folder, filename)
        print(train_folder)
        os.makedirs(os.path.join(train_folder, os.path.basename(folder)), exist_ok = True)
        dst_path = os.path.join(train_folder, os.path.basename(folder), filename)
        shutil.copy(src_path, dst_path)
    for filename in val_filenames:
        src_path = os.path.join(folder, filename)
        os.makedirs(os.path.join(train_folder, os.path.basename(folder)), exist_ok = True)
        dst_path = os.path.join(val_folder, os.path.basename(folder), filename)
        shutil.copy(src_path, dst_path)