创建自己的VOC2007数据集

原文链接:创建自己的VOC2007数据集

其他链接:DETRAC-Train-Images转换成VOC格式的数据集

机器学习实践系列之7 - 车辆检测

一:VOC2007数据集简介

PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集,从2005年到2012年每年都会举行一场图像识别challenge。

VOC2007数据集是衡量图像分类识别能力的基准,faster-rcnn,yolo -v1, yolo-v2都以此数据集作为演示样例。

VOC2007数据格式如下:

  • Annotations ——xml标注文件
  • ImageSets ——类别标签
  • JPEGImages ——jpg图像文件
  • SegmentationClass
  • SegmentationObjec

训练自己的数据时只需要修改Annotations、ImageSets、JPEGImages 三个文件夹。

 

二:数据就制作流程

1:把所有ipg文件放入JPEGImages文件夹中(此处可以使用批量命名工具重新命名)下载链接:http://cl.wxyngq.com/download/%E6%89%B9%E9%87%8F%E4%BF%AE%E6%94%B9%E6%96%87%E4%BB%B6%E5%90%8D_48@93774.exe

2:使用labelimg标注文件,可以直接下载exe可执行工具或者下载源码执行(此处百度一下有很多)。该工具可实现手动标注后生成XML文件中含有目标位置:name为目标分类,bndbox中为目标左上和右下两个点的坐标信息。

  一般模型,比如YOLO网络就是通过读取所有xml文件的信息来生成模型需要的label文件。

3:将标注好的xml文件放到Annotations文件夹下

4:生成ImageSets\Main文件夹下4个txt文件test.txt , train.txt , trainval.txt , val.txt。

 这四个文件夹中存储的时上一步中xml文件的文件名。trainval和 test内容相加为所有xml文件,train和val内容相加为trainval。

 可使用下面脚本生成,运行将该文件与ImageSets和Annotations放在同一目录下。

代码:

import os  
import random  
  
trainval_percent = 1  # trainval数据集占所有数据的比例
train_percent = 0.5  # train数据集占trainval数据的比例
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)  
  
num=len(total_xml)  
list=range(num)  
tv=int(num*trainval_percent)  
tr=int(tv*train_percent)  
trainval= random.sample(list,tv)  
train=random.sample(trainval,tr)  
  
ftrainval = open('ImageSetsMini/Main/trainval.txt', 'w')  
ftest = open('ImageSetsMini/Main/test.txt', 'w')  
ftrain = open('ImageSetsMini/Main/train.txt', 'w')  
fval = open('ImageSetsMini/Main/val.txt', 'w')  
  
for i  in list:  
    name=total_xml[i][:-4]+'\n'  
    if i in trainval:  
        ftrainval.write(name)  
        if i in train:  
            ftrain.write(name)  
        else:  
            fval.write(name)  
    else:  
        ftest.write(name)  
  
ftrainval.close()  
ftrain.close()  
fval.close()  
ftest .close()
5:用修改了Annotations、ImageSets、JPEGImages\Main 三个文件夹的数据替换原来的数据,就可以跑自己的数据啦,当然可能该需要修改一些模型参数。



  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
VOC2007行人数据集是一个被广泛使用于计算机视觉领域,用于目标检测和行人姿势估计等任务的数据集。该数据集由VOC(视觉对象类别)计划创建,旨在促进计算机视觉相关研究的发展和评估。 VOC2007行人数据集包含了来自真实场景的图像,这些图像以不同的角度和姿势拍摄,同时还包含了行人的真实边界框标注和姿势信息。数据集中的图像来自多个场景,如街道、公园等,提供了丰富的视角和光照条件,使得该数据集具有一定的挑战性。 该数据集中的每张图像都经过严格的标注,其中包含行人的位置和姿势信息。行人的位置标注使用矩形边界框表示,该边界框准确定位了图像中行人的位置。姿势标注则是描述了行人的姿势,如站立、行走等。这些标注信息有助于研究者在目标检测和行人姿势估计等任务中训练和评估模型的性能。 VOC2007行人数据集的使用方便且应用广泛。研究者可以将该数据集用于训练和测试目标检测算法,以提高行人检测的精度和鲁棒性。同时,该数据集还可以用于行人姿势估计算法的评估和改进。研究者可以基于该数据集开展各种相关研究,如行人跟踪、行人重识别等。 总体而言,VOC2007行人数据集是一个被广泛应用于计算机视觉领域的数据集,通过提供包含行人位置和姿势信息的真实图像,为研究者提供了一个有效的工具来训练和评估目标检测和行人姿势估计等算法的性能。该数据集具有一定的挑战性,可以帮助研究者突破技术瓶颈,提升计算机视觉相关任务的准确度和鲁棒性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值