总目标:建立VOC格式数据集类以及操作函数库
VOC类库存储在VOC.py中,单个xml文件操作函数库存储在VOCOperationLibrary.py
VOC类import VOCOperationLibrary as vol
github项目地址(附有使用说明书):
https://github.com/A-mockingbird/VOCtype-datasetOperation
Day5.根据train.txt分离数据集
内容:
根据VOC数据集格式目录中ImageSets/Main/路径下train_val.txt或train.txt文件。
将数据集中的图片和标注文件分离为训练集和测试集不同文件中。
输入:
taintxt:train.txt或train_val.txt文件路径
savedir:分离后数据集存储目录
annodir:数据集标注文件目录
imgdir:数据集图像文件目录
def _Splitdataset(self, traintxt, savedir, annodir=None, imgdir=None):
"""
Split the dataset into train set and test set, according the train.txt.
Precondition:
traintxt:train.txt which include the train set file name
savedir:save direction