voc2007数据集的制作

最新推荐文章于 2024-04-28 17:57:29 发布

和美琪一起的日子里

最新推荐文章于 2024-04-28 17:57:29 发布

阅读量260

点赞数

本文链接：https://blog.csdn.net/weixin_43202256/article/details/83058307

版权

相信看这篇文章的人都在做深度学习吧，此数据集是为目标检测做的数据集，有错误处请海涵

代码见我的github上：https://github.com/EddyGao/make_VOC2007
第一步：首先了解VOC2007数据集的格式

1)JPEGImages文件夹

文件夹里包含了训练图片和测试图片，混放在一起

2)Annatations文件夹

文件夹存放的是xml格式的标签文件，每个xml文件都对应于JPEGImages文件夹的一张图片

3)ImageSets文件夹

Action存放的是人的动作，我们暂时不用

Layout存放的人体部位的数据。我们暂时不用

Main存放的是图像物体识别的数据，分为20类，当然我们自己制作就呵呵呵不一定了，如果你有精力，Main里面有test.txt , train.txt, val.txt ,trainval.txt.这四个文件我们后面会生成

Segmentation存放的是可用于分割的数据

4)其他的文件夹不解释了，分割XXX等用的

如果你下载了VOC2007数据集，那么把它解压，把各个文件夹里面的东西删除，保留文件夹名字。如果没下载，那么就仿照他的文件夹格式，自己建好空文件夹就行。

第二步：搞定JPEGSImages文件夹

1)把你的图片放到JPEGSImages里面，在VOC2007里面，人家的图片文件名都是000001.jpg类似这样的，我们也统一格式，把我们的图片名字重命名成这样的，如果你的文件太多怎么办，请看我的另一篇文章http://blog.csdn.net/gaohuazhao/article/details/60324715 能批量重命名文件

第三步：搞定Annatations文件夹

网上很多教程，但是我觉得都很麻烦，直到我遇到了一位大神做的软件，手动标注，会自动生成图片信息的xml文件

1)在这里下载：https://github.com/tzutalin/labelImg，至于怎么用相信你打开就知道了

2)保存的路径就是我们的Annatations文件夹，别保存别的地方去了，，，

3)一张张的慢慢画框。。。。。。。。。大约过了几个小时，好继续下一步

第四步：搞定ImageSets文件夹中的Main文件夹中的四个文件

直接上一个代码给你：


 
 
   
   
    
    
   
   
   
   
    
    
     
     import os
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     import random
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     trainval_percent = 
     
     0.66
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     train_percent = 
     
     0.5
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     xmlfilepath = 
     
     'Annotations'
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     txtsavepath = 
     
     'ImageSets\Main'
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     total_xml = os.listdir(xmlfilepath)
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     num=len(total_xml)
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     list=range(num)
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     tv=int(num*trainval_percent)
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     tr=int(tv*train_percent)
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     trainval= random.sample(list,tv)
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     train=random.sample(trainval,tr)
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     ftrainval = open(
     
     'ImageSets/Main/trainval.txt', 
     
     'w')
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     ftest = open(
     
     'ImageSets/Main/test.txt', 
     
     'w')
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     ftrain = open(
     
     'ImageSets/Main/train.txt', 
     
     'w')
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     fval = open(
     
     'ImageSets/Main/val.txt', 
     
     'w')
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     for i  
     
     in list:
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
         name=total_xml[i][:
     
     -4]+
     
     '\n'
    
    
   
   

   
   
    
    
   
   
   
   
    
        
     
     if i 
     
     in trainval:
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
             ftrainval.write(name)
    
    
   
   

   
   
    
    
   
   
   
   
    
            
     
     if i 
     
     in train:
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
                 ftrain.write(name)
    
    
   
   

   
   
    
    
   
   
   
   
    
            
     
     else:
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
                 fval.write(name)
    
    
   
   

   
   
    
    
   
   
   
   
    
        
     
     else:
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
             ftest.write(name)
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     ftrainval.close()
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     ftrain.close()
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     fval.close()
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     ftest .close()

OK，制作完成，就是这么简单，那么解释一下这四个txt文档是干嘛的，看名字就知道，就是分分多少图片作为训练，多少图片作为测试，，，，

我们将继续填坑

和美琪一起的日子里

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
voc2007数据集的制作

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/gaohuazhao/article/details/60871886 相信看这篇文章的人都在做深度学习吧，此数据集是为目标检测做的数据集，有错误处请海涵代码见我的github上：https://g...
复制链接

扫一扫