VOC****中原始test数据解析收集

import os
import random

trainval_percent = 0.2
train_percent = 0.8
xmlfilepath = '/home/hanqing/SSD-Tensorflow-master/VOC2019/Annotations'
txtsavepath = '/home/hanqing/SSD-Tensorflow-master/VOC2019/ImageSets/Main'
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('/home/hanqing/SSD-Tensorflow-master/VOC2019/ImageSets/Main/trainval.txt', 'w')
ftest = open('/home/hanqing/SSD-Tensorflow-master/VOC2019/ImageSets/Main/test.txt', 'w')
ftrain = open('/home/hanqing/SSD-Tensorflow-master/VOC2019/ImageSets/Main/train.txt', 'w')
fval = open('/home/hanqing/SSD-Tensorflow-master/VOC2019/ImageSets/Main/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftest.write(name)
        else:
            fval.write(name)
    else:
        ftrain.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 一些常用的3*224*224大小的图像分类数据集有: - ImageNet: 是一个非常流行的图像数据集,包含超过1400万张图片,分为1000个类别。 - CIFAR-10: 是另一个广泛使用的图像分类数据集,包含60000张32*32的彩色图片,分为10个类别。 - COCO: (Common Objects in Context) 是一个用于目标检测,分割和图像标注的大型图像数据集,包含超过 330K 张图片, 80 个类别。 - PASCAL VOC: 是另一个用于图像分类和实例分割的数据集, 有20类物体, 包含17125张图片. ### 回答2: 以下是几个常见的3*224*224大小的图像分类数据集推荐: 1. MNIST:虽然MNIST数据的图像是28*28大小的灰度图像,但你可以将其调整为3*224*224的大小。这个数据集主要用于数字图像分类,共有10个类别,非常适合初学者。 2. CIFAR-10:这是一个包含10个类别的图像分类数据集。每个图像的尺寸为32*32*3,因此你可以将其调整为3*224*224的大小。 3. ImageNet:这是一个包含超过1000个类别的大规模图像分类数据集。每个图像的尺寸为3*256*256,你可以将其调整为3*224*224的大小。ImageNet是深度学习领域经常用于训练模型的数据集之一。 4. Caltech-101:这个数据集包含101个不同类别的图像。每个图像尺寸都不一样,但是你可以将其调整为3*224*224的大小来进行分类任务。 5. Stanford Dogs:这是一个包含120个不同品种狗的图像分类数据集。每个图像的尺寸也不一样,但你可以将其调整为3*224*224的大小。 希望这些数据集能够满足你的需求,帮助你进行图像分类任务的学习和实践。 ### 回答3: 以下是一些3*224*224大小的图像分类数据集的推荐: 1. ImageNet:ImageNet是一个大规模的图像数据库,包含了来自各种类别的超过一百万张图像。该数据集是图像分类和物体识别任务最常用的基准数据集之一。 2. CIFAR-10和CIFAR-100:CIFAR-10包含10个类别的图像,每个类别有6000张。CIFAR-100是CIFAR-10的扩展版本,包含100个类别的图像。这两个数据集是计算机视觉领域广泛使用的数据集,常用于测试分类算法的性能。 3. MNIST:MNIST是一个手写数字分类数据集,包含了来自0到9的数字图片。数据集包含60000张训练图像和10000张测试图像。MNIST是深度学习领域最常用的数据集之一,适用于学习和开发基本的图像分类算法。 4. Fashion-MNIST:Fashion-MNIST是一个衣服图像分类数据集,包含10个类别的衣服图片。它是MNIST数据集的替代版本,用于评估图像分类算法在更具挑战性的任务上的性能。 5. Caltech-101:Caltech-101是一个包含101个对象类别的数据集,每个类别大约有40-800张图像。这个数据集适用于较为复杂的图像分类任务。 这些数据集广泛使用于图像分类算法的研究和开发过程,提供了不同的数据规模和难度,可以帮助测试和评估模型的性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

读书小孩

您的打赏将是我前行的动力源

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值