PASCAL VOC2012类型的数据集生成train.txt\val.txt等文件

最新推荐文章于 2023-08-07 13:30:14 发布

Procrastinator^_^

最新推荐文章于 2023-08-07 13:30:14 发布

阅读量3.2k

点赞数 6

分类专栏：笔记文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/SiuooooBoom/article/details/120431420

版权

笔记专栏收录该内容

21 篇文章 0 订阅

订阅专栏

PASCAL VOC 2012

图像分割经常要用的到这个数据集，我是自己做的数据集，但也仿照了PASCAL VOC2012的格式，在数据中，需要把所有图片放在一个文件夹中，mask放在另一个文件夹中，然后train.txt等文件里面有很多文件名，决定了哪些图片用于train，哪些用于val。

要生成的txt

train.txt
val.txt
test.txt
trainval.txt（这个是train和val放在一起的）
分的思路是从全部文件中，先分出trainval，然后再从trainval中，分出val，这样train、val、test就都有了。

代码

import os
import random

# 设置图片路径和txt存放的路径
file_path = r'/home/rtx2080ti/SISnet/pytorch-deeplab-xception-master/1part_dataset/JPEGImages'
saveBasePath = r'/home/rtx2080ti/SISnet/pytorch-deeplab-xception-master/1part_dataset/ImageSets/Segmentation/'

# 设置数据集比例，其中trainval是指train+val
train_percent = 0.6
val_percent = 0.2
test_percent = 0.2                                   # 其实这个数字就用不到

# 求出数据总的数目
total_image = os.listdir(file_path)                  # 将文件名存为一个列表，这时是包含拓展名的
num = len(total_image)                               # 总的文件数
list = range(num)

# 求出各部分的数目
train_number = int(num * train_percent)
val_number = int(num * val_percent)
test_number = int(num * test_percent)                # 这个数字也用不到其实
trainval_number = int(train_number + val_number)

# 各部分的样本
trainval = random.sample(list, trainval_number)      # 从总的数据集中，先挑train+val，再从train+val中，挑出train
train = random.sample(trainval, train_number)
print(trainval)
print(train)

# 确认数据集各部分的数目
print("train加val的数目", trainval_number)
print("train的数目", train_number)

# 建立每部分的txt
ftrainval = open(os.path.join(saveBasePath, 'trainval.txt'), 'w')
ftest = open(os.path.join(saveBasePath, 'test.txt'), 'w')
ftrain = open(os.path.join(saveBasePath, 'train.txt'), 'w')
fval = open(os.path.join(saveBasePath, 'val.txt'), 'w')

# 进行写文件名
for i in list:
    name = total_image[i][:-4] + '\n'               # 去掉拓展名
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)

# 关闭txt文件
ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

Procrastinator^_^

关注

6
点赞
踩
28

收藏

觉得还不错? 一键收藏
2
评论
PASCAL VOC2012类型的数据集生成train.txt\val.txt等文件

PASCAL VOC 2012图像分割经常要用的到这个数据集，我是自己做的数据集，但也仿照了PASCAL VOC2012的格式，在数据中，需要把所有图片放在一个文件夹中，mask放在另一个文件夹中，然后train.txt等文件里面有很多文件名，决定了哪些图片用于train，哪些用于val。要生成的txttrain.txtval.txttest.txttrainval.txt（这个是train和val放在一起的）分的思路是从全部文件中，先分出trainval，然后再从trainval中，分出va
复制链接

扫一扫

专栏目录