目标检测之VOC2007格式数据集制作

最新推荐文章于 2025-11-05 14:01:07 发布

原创最新推荐文章于 2025-11-05 14:01:07 发布 · 1.5w 阅读

166 ·

CC 4.0 BY-SA版权

机器学习/深度学习专栏收录该内容

17 篇文章

订阅专栏

本文介绍如何创建符合VOC2007格式的目标检测数据集，包括搭建文件结构、使用LabelImg工具标注图像及生成训练、测试集划分文件。

1.前序

前几天师弟问我如何做自己的VOC2007数据集的事情，当时跟他说网上资料很多，让他自己查查，但不知道什么原因和我说还是没搞好。自己想想也是，不熟悉的东西即便在别人眼里看似很简单，到了自己跟前也变得深奥到天际。所以这里方便大家一起学习就写了这篇博客，供大家和师弟参考，如有错误的地方还请大家指教。
在做目标检测时，我们需要准备好自己的数据集，将其制作为VOC2007格式的数据集，这里可以下载原始VOC2007数据集：VOC2007数据集，我们来看看这个数据集到底是什么样的。

解压VOC2007数据集后可以看到VOC2007文件夹下有以下5个文件夹：

Annotations文件夹
该文件下存放的是xml格式的标签文件，每个xml文件都对应于JPEGImages文件夹的一张图片。
JPEGImages文件夹
改文件夹下存放的是数据集图片，包括训练和测试图片。
ImageSets文件夹
该文件夹下存放了三个文件，分别是Layout、Main、Segmentation。在这里我们只用存放图像数据的Main文件，其他两个暂且不管。
SegmentationClass文件和SegmentationObject文件。
这两个文件都是与图像分割相关。

2.开始制作

制作自己的VOC2007格式数据集其实不需要上述那么多内容，我们只要做三个部分即可：Annotations文件夹、JPEGImages文件夹、ImageSets文件夹下的Main文件。

第一步：我们参照原始VOC2007数据集的文件层次创建上述四个文件夹，也就是创建一个VOCdevkit文件夹，下面再创建Annotations、JPEGImages、ImageSets三个文件夹，最后在ImageSets文件夹下再创建一个Main文件夹。
创建好所有文件夹后，我们将自己的数据集图片都放到JPEGImages文件夹下。按照习惯，我们将图片的名字修改为000001.jpg这种格式的（参照原始数据集图片命名规则），统一命名方法网络上有很多，网上很多，这里就不多赘述了。
另外强调两点：第一点是图片的格式，图片需是JPEG或者JPG格式，其他格式需要转换一下。第二点是图片的长宽比，图片长宽比不能太大或太小，这个参考原始VOC2007数据集图片即可。

第二步：我们来制作Annotations文件夹下所需要存放的xml文件。这里我们需要借助大神带给我们的福利了：LabelImg工具，可以按照上面的说明进行安装和使用。看到满篇的英文是不是很晕，那这里有个简单的方法可以帮助到大家！当然lxml 库文件还是要装的，但如果你用的是Anaconda环境，那么你什么都不用做，只需要点击这里：LabelImg标注工具，根据自己的情况选择下载window版本还是linux版本，然后解压使用就行了！
关于如何使用，这里以window版本的为例说明。下载解压后会得到一个exe可执行文件，另一个是data文件夹，这里面有个txt文件，内容是预定义的分类标签名，里面的标签可以根据自己的需要进行修改。执行exe文件打开标注界面就可以进行操作了，操作方法可以参考这篇文章：使用方法
这里给张标注工具的参考图：
这里写图片描述
下面就进行漫长的标注工作吧。。。
说明：每标注完一张图片后进行保存，保存的xml文件名要与对应图片名一致，大家可以参考原始VOC2007数据集中JPEGImages文件夹下图片的命名和Annotations文件夹中的xml文件命名规则。
备注：这里还有个制作工具VOC2007数据格式制作工具也很好用，大家也可以试一试。这个是在网上看到的，忘记作者了，在这里表示感谢。

第三步：我们来制作ImageSets文件夹下Main文件夹中的4个文件（test.txt、train.txt、trainval.txt、val.txt）。
首先我们先来了解下这四个文件到底是干什么用的，当然从文件的命名上我们也都能大体猜得上来他们的作用，不过这里还是简单的说明一下吧。
test.txt：测试集
train.txt：训练集
val.txt：验证集
trainval.txt：训练和验证集

在原始VOC2007数据集中，trainval大约占整个数据集的50%，test大约为整个数据集的50%；train大约是trainval的50%，val大约为trainval的50%。所以我们可参考以下代码来生成这4个txt文件：

import os  
import random  
  
trainval_percent = 0.5  
train_percent = 0.5  
xmlfilepath = 'Annotations'  
txtsavepath = 'ImageSets/Main'  
total_xml = os.listdir(xmlfilepath)  
  
num=len(total_xml)  
list=range(num)  
tv=int(num*trainval_percent)  
tr=int(tv*train_percent)  
trainval= random.sample(list,tv)  
train=random.sample(trainval,tr)  
  
ftrainval = open(txtsavepath+'/trainval.txt', 'w')  
ftest = open(txtsavepath+'/test.txt', 'w')  
ftrain = open(txtsavepath+'/train.txt', 'w')  
fval = open(txtsavepath+'/val.txt', 'w')  
  
for i  in list:  
    name=total_xml[i][:-4]+'\n'  
    if i in trainval:  
        ftrainval.write(name)  
        if i in train:  
            ftrain.write(name)  
        else:  
            fval.write(name)  
    else:  
        ftest.write(name)  
  
ftrainval.close()  
ftrain.close()  
fval.close()  
ftest .close()

注意：上述代码中涉及到的路径要写全，另外各个数据集所占比例根据实际数据集的大小调整比例。

至此，我们自己的VOC2007格式数据集就全部制作完成了。

25 条评论

weixin_42507954 2020.06.05
博主，请问我生成的为什么不显示正负样本啊
- qq_41003334回复weixin_42507954 2022.04.18
  你好，请问您的问题解决了吗？我也遇到了同样的问题

我装作听不懂的样子~ 2019.07.07
您好、下载VOC2007后、发现每个类也要生成4个对应的txt文件、这个应该如何生辰
- gulingfengze回复我装作听不懂的样子~ 2019.07.11
  [reply]weixin_43229295[/reply] 实际是不需要那么多的，最多需要四个：trainval.txt train.txt val.txt test.txt ，每一个txt中包含所有类别的图片名称即可

qq_625379925 2019.05.09
您好，有些使用了07+12的voc的训练集，里面包含2007一个文件夹，2012一个文件夹，训练之前需要合并成一个么还是代码里有脚本进行了处理分别索引最后合并成完整的数据集呢？
- 火星吃瓜回复qq_625379925 2020.04.21
  [reply]qq_42053502[/reply]我也有同样的疑问，还需要生成个图像列表
- gulingfengze回复qq_625379925 2019.05.09
  [reply]qq_42053502[/reply] 2007和2012数据集在结构上基本是一样的，如果你下载官方VOC数据，存在一个压缩包解压后存在2007和2012的情况，至于数据如何使用，这个是需要根据实际情况而定。

麻雀2025 2018.12.28
百度云被吞了TAT
- gulingfengze回复麻雀2025 2018.12.28
  [reply]qq_43208303[/reply] 已经更新了连接，现在可以下载了.

qq_40842067 2018.12.01
您好，请问您有没有做过SSD-TensorFlow的项目，我训练完模型之后要测试模型，出现了一下问题：InvalidArgumentError: Assign requires shapes of both tensors to match. lhs shape= [3,3,256,102] rhs shape= [3,3,256,126]，请问您遇到过吗？具体怎么解决？谢谢。
- qq_40842067回复gulingfengze 2018.12.02
  [reply]gulingfengze[/reply] 刚加您了，807336070
- gulingfengze回复qq_40842067 2018.12.02
  [reply]qq_40842067[/reply] 可以的，扣：1220364582
- qq_40842067回复gulingfengze 2018.12.02
  [reply]gulingfengze[/reply] 首先谢谢您对我问题的回复。我最近在尝试用自己的数据训练网络，有些问题想请教您，可以加一下您的QQ吗？
- gulingfengze回复qq_40842067 2018.12.01
  [reply]qq_40842067[/reply] 你好，我没遇到过这个问题，你可以参考这个链接查一下：https://github.com/tensorflow/models/issues/5806

qq_40842067 2018.11.27
您好，您最后说“各个数据集所占比例根据实际数据集的大小调整比例”，请问具体是怎样调整，这个比例对后期的训练影响大吗？
- qq_40842067回复gulingfengze 2018.11.28
  [reply]gulingfengze[/reply] 嗯嗯，谢谢
- gulingfengze回复qq_40842067 2018.11.27
  [reply]qq_40842067[/reply] 这个比例是划分数据集的比例，没什么特别的要求。一般而言，训练集：验证集：测试集=8：1：1，这个没有严格规定的。 trainval_percent = 0.5 train_percent = 0.5 这里的比例可以随意调整的，对后期的训练没有直接影响。

csdn_bokeyuan_123 2018.07.01
你好,我在执行生成txt文件的代码后一直报错 FileNotFoundError: [Errno 2] No such file or directory: 'Annotations',但是我明明创建了Annotations文件了,不知道怎么错了,你能给指导一下吗
- weixin_41893146回复csdn_bokeyuan_123 2018.10.15
  [reply]csdn_bokeyuan_123[/reply] 在根目录下执行代码操作
- csdn_bokeyuan_123回复gulingfengze 2018.07.01
  [reply]gulingfengze[/reply] 找到问题了,谢谢
- gulingfengze回复csdn_bokeyuan_123 2018.07.01
  [reply]csdn_bokeyuan_123[/reply] 这事我在windows的写法：xmlfilepath = 'C:/Users/glfz/Desktop/Annotations'
- gulingfengze回复csdn_bokeyuan_123 2018.07.01
  [reply]csdn_bokeyuan_123[/reply] 在ubuntu上也是可以使用的。你的路径应该还是写错了，我这边在windows上试了没问题，你能贴出你这块路径的代码么？
- csdn_bokeyuan_123回复gulingfengze 2018.07.01
  [reply]gulingfengze[/reply]之前在bantu系统下没法安装labelimg,所以在windows下制作了标注.那么在windows系统下生成的标注还有xml文件在Ubuntu系统下可以用吗
- csdn_bokeyuan_123回复gulingfengze 2018.07.01
  [reply]gulingfengze[/reply] 是的,能不能加qq3498248060
- gulingfengze回复csdn_bokeyuan_123 2018.07.01
  [reply]csdn_bokeyuan_123[/reply] 没找到文件夹说明文件路径有误，你写的是绝对路径么?