个人微信公众号:AI研习图书馆,欢迎关注~
深度学习知识及资源分享,学习交流,共同进步~
VOC数据集中txt文件的制作方法
1.引言
本文介绍两种VOC数据集txt文件生成方法,一种是Python实现,一种是MATLAB实现,大家根据自身硬件和需要选择实现方式,免费分享代码。
众所周知,VOC数据集中,在ImageSet目录下包含Main文件,在ImageSets\Main里需要生成四个txt文件,分别是:test.txt train.txt trainval.txt val.txt。下面我们就来介两种实现方案。
2. 实现方案
常用数据集划分比例介绍如下,大家可以自己的实际数据量和训练需要自行修改相应比例,灵活变通~
常用数目比例:
trainval: 约占整个数据集的50%
test :约占整个数据集的50%
train :约占trainval的50%
val :约占trainval的50%
2. 1 Python实现
生成这四个txt文件的Python代码如下,根据自己的路径修改即可:
import os
import random
trainval_percent = 0.5 #设置比例
train_percent = 0.5
xmlfilepath = 'Annotations' # 修改路径
txtsa