数据集比例划分脚本

最新推荐文章于 2023-10-12 21:00:04 发布

Rane0

最新推荐文章于 2023-10-12 21:00:04 发布

阅读量506

点赞数 1

分类专栏：脚本工具文章标签：深度学习人工智能机器学习

本文链接：https://blog.csdn.net/yirui50/article/details/125464219

版权

脚本工具专栏收录该内容

1 篇文章 0 订阅

订阅专栏

训练集:测试集:验证集 = 8:1:1划分

# -*- coding:utf-8 -*-

import torch
import torchvision.datasets as dset

dataset = dset.ImageFolder('/home/rane/data/dataset')  #数据集目录
dataset.classes
dataset.class_to_idx

data = []
for file in dataset.imgs:
    data.append(file)

print(len(data))

train_size = int(0.8 * len(data))
test_size  = int(0.1 * len(data))
val_size   = int(0.1 * len(data))


print("train_size:{}".format(train_size))
print("test_size:{}".format(test_size))
print("val_size:{}".format(val_size))

train_dataset, test_dataset, val_dataset = torch.utils.data.random_split(data, [train_size, test_size, val_size])


train_imgList_line = []

for line in train_dataset:
    train_imgList_line.append(line[0])

with open('train.txt', 'wt') as f:
    i = 0
    for line in train_imgList_line:
        if i == train_size:
            break

		f.write(str(line) + '\n')
        i = i + 1


test_imgList_line = []

for line in test_dataset:
    test_imgList_line.append(line[0])


with open('test.txt', 'wt') as f:
    i = 0
    for line in test_imgList_line:
        if i == test_size:
            break

		f.write(str(line) + '\n')
        i = i + 1




val_imgList_line = []

for line in val_dataset:
    val_imgList_line.append(line[0])

with open('val.txt', 'wt') as f:
    j = 0
    for line in val_imgList_line:
        if j == val_size:
            break

		f.write(str(line) + '\n')
        j = j + 1