制作自己的VOC2007数据集

本文介绍了如何制作类似于VOC2007的数据集,包括放置图片和XML注释文件的目录结构,以及如何使用Python脚本随机分割数据集为训练集、验证集和测试集。提供了分割样本的Python代码,该代码会生成trainval.txt、test.txt、train.txt和val.txt文件,分别对应不同用途的数据集。
摘要由CSDN通过智能技术生成

制作自己的VOC2007数据集
在这里插入图片描述
JPEGImages放的jpg格式的图片

Annotations 放的是xml 形式,文件名与图片名一一对应(可用labelimg)

ImageSets下有Main文件夹

最后,要把样本分割为训练集、验证集、测试集等。分割情况会在/VOC2007/ImageSets/Main文件夹内的txt文件中进行记录。这里应该有4个txt文件,分别是:train.txt(用于训练的样本,25%)、val.txt(用于验证的样本,25%)、trainval.txt(train与val的合集)、test.txt(用于测试的样本,50%)。

可以将下列的make_txt.py文件,把它放到/VOC2007路径下,然后运行这个python文件,就可以得到样本的分割结果。

import os
import random

trainval_percent = 0.5
train_percent = 0.5
xmlfilepath = ‘./Annotations/’
txtsavepath = ‘./ImageSets/Main/’
total_xml = os.listdir(xmlfilepath)

num=len(total_xml)
list=range(num)
tv=int(numtrainval_percent)
tr=int(tv
trai

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值