2023 数据集自动分配为训练集，测试集，验证集过程讲解

最新推荐文章于 2024-05-21 17:06:30 发布

晨钟•暮鼓

最新推荐文章于 2024-05-21 17:06:30 发布

阅读量114

点赞数

文章标签：深度学习人工智能机器学习 python 图像处理

本文链接：https://blog.csdn.net/qq_50455054/article/details/134297940

版权

准备工作

然后执行下面一段代码，需要修改的地方已经详细标注，只需要替换为自己的路径即可


import random
import os
import shutil

#    共有3处需要修改

#需要修改   1

#  修改训练集、验证集和测试集的比例分配
#  要分割的数据集数量要能被分配比例整除

train_percent = 0.8
test_percent = 0.1
valid_percent = 0.1


#需要修改  2

# 原始标注文件的路径（被分割的原始文件）
# 改成自己的路径
image_path = '.../.../images'
label_path = '.../.../labels'

images_files_list = os.listdir(image_path)
labels_files_list = os.listdir(label_path)
print('images files: {}'.format(images_files_list))
print('labels files: {}'.format(labels_files_list))


total_num = len(images_files_list)
print('total_num: {}'.format(total_num))

test_num = int(total_num * test_percent)
valid_num = int(total_num * valid_percent)
train_num = int(total_num * train_percent)

# 对应文件的索引
test_image_index = random.sample(range(total_num), test_num)
valid_image_index = random.sample(range(total_num), valid_num)
train_image_index = random.sample(range(total_num), train_num)


#需要修改  3

for i in range(total_num):
    print('src image: {}, i={}'.format(images_files_list[i], i))
    if i in test_image_index:

        #   '.../.../images/{}' 原始标注文件的路径（被分割的原始文件）  ,  '...../test/images/{}'分配后的文件存放的地点
        #   改成自己的路径
        shutil.copyfile('.../.../images/{}'.format(images_files_list[i]), '...../test/images/{}'.format(images_files_list[i]))
        shutil.copyfile('.../.../labels/{}'.format(labels_files_list[i]), '...../test/labels/{}'.format(labels_files_list[i]))
    elif i in valid_image_index:
        shutil.copyfile('.../.../images/{}'.format(images_files_list[i]), '...../valid/images/{}'.format(images_files_list[i]))
        shutil.copyfile('.../.../labels/{}'.format(labels_files_list[i]), '...../valid/labels/{}'.format(labels_files_list[i]))
    else:
        shutil.copyfile('.../.../images/{}'.format(images_files_list[i]), '...../train/images/{}'.format(images_files_list[i]))
        shutil.copyfile('.../.../labels/{}'.format(labels_files_list[i]), '...../train/labels/{}'.format(labels_files_list[i]))

执行完成后，数据集已分配完毕

晨钟•暮鼓

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
2023 数据集自动分配为训练集，测试集，验证集过程讲解

数据集自动分配为训练集，测试集，验证集
复制链接

扫一扫

2023 数据集自动分配为训练集，测试集，验证集 过程讲解

准备工作

“相关推荐”对你有帮助么？

2023 数据集自动分配为训练集，测试集，验证集过程讲解