制作自己的VOC2007数据集

最新推荐文章于 2024-11-08 13:43:44 发布

qq_41672012

最新推荐文章于 2024-11-08 13:43:44 发布

阅读量394

点赞数

文章标签： python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41672012/article/details/105748716

版权

本文介绍了如何制作类似于VOC2007的数据集，包括放置图片和XML注释文件的目录结构，以及如何使用Python脚本随机分割数据集为训练集、验证集和测试集。提供了分割样本的Python代码，该代码会生成trainval.txt、test.txt、train.txt和val.txt文件，分别对应不同用途的数据集。

摘要由CSDN通过智能技术生成

制作自己的VOC2007数据集
在这里插入图片描述
JPEGImages放的jpg格式的图片

Annotations 放的是xml 形式，文件名与图片名一一对应（可用labelimg）

ImageSets下有Main文件夹

最后，要把样本分割为训练集、验证集、测试集等。分割情况会在/VOC2007/ImageSets/Main文件夹内的txt文件中进行记录。这里应该有4个txt文件，分别是：train.txt（用于训练的样本，25%）、val.txt（用于验证的样本，25%）、trainval.txt（train与val的合集）、test.txt（用于测试的样本，50%）。

可以将下列的make_txt.py文件，把它放到/VOC2007路径下，然后运行这个python文件，就可以得到样本的分割结果。

import os
import random

trainval_percent = 0.5
train_percent = 0.5
xmlfilepath = ‘./Annotations/’
txtsavepath = ‘./ImageSets/Main/’
total_xml = os.listdir(xmlfilepath)

num=len(total_xml)
list=range(num)
tv=int(numtrainval_percent)
tr=int(tvtrai

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。