PASCAL VOC数据集训练集、验证集、测试集的划分和提取，得到test.txt、train.txt、trainval.txt、val.txt文件代码

最新推荐文章于 2023-08-07 13:30:14 发布

LiBiGo

最新推荐文章于 2023-08-07 13:30:14 发布

阅读量2.9k

点赞数 3

分类专栏： # Pytorch数据集Tools 文章标签： python 深度学习人工智能

本文链接：https://blog.csdn.net/qq_39237205/article/details/128889413

版权

Pytorch数据集Tools 专栏收录该内容

23 篇文章 10 订阅

订阅专栏

训练集、验证集、测试集按比例精确划分

创建py文件，将下属代码放入所创建的文件里，VOC2007数据集与py文件在同一目录下
在这里插入图片描述

# 数据集划分
import os
import random

root_dir = './VOC2007/'


## trainval_percent为 train 与 val在整个数据集中的比例
trainval_percent = 0.8
# train_percent 为 train在整个数据集中的比例
train_percent = 0.7
# 因此上述配置得到
## 0.7train 0.1val 0.2test


xmlfilepath = root_dir + 'Annotations'
txtsavepath = root_dir + 'ImageSets/Main'
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)  # 100
list = range(num)
tv = int(num * trainval_percent)  # 80
tr = int(tv * train_percent)  # 80*0.7=56
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open(root_dir + 'ImageSets/Main/trainval.txt', 'w')
ftest = open(root_dir + 'ImageSets/Main/test.txt', 'w')
ftrain = open(root_dir + 'ImageSets/Main/train.txt', 'w')
fval = open(root_dir + 'ImageSets/Main/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

实验结果

在这里插入图片描述

LiBiGo

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
PASCAL VOC数据集训练集、验证集、测试集的划分和提取，得到test.txt、train.txt、trainval.txt、val.txt文件代码

创建py文件，将下属代码放入所创建的文件里，VOC2007数据集与py文件在同一目录下。
复制链接

扫一扫