SSD制作自己的数据集

最新推荐文章于 2024-07-26 00:47:19 发布

落花逐流水

最新推荐文章于 2024-07-26 00:47:19 发布

阅读量789

点赞数

分类专栏：目标检测 pytorch

本文链接：https://blog.csdn.net/juluwangriyue/article/details/117148626

版权

pytorch 同时被 2 个专栏收录

94 篇文章 12 订阅

订阅专栏

目标检测

7 篇文章 1 订阅

订阅专栏

本文详细介绍了如何制作适用于SSD算法的目标检测数据集，包括理解VOC2007数据集结构，下载图片并统一命名，使用labelImg工具进行标注，以及生成ImageSets/Main文件夹下的.txt索引文件。关键步骤包括图片收集、标签创建和训练/测试集划分。

摘要由CSDN通过智能技术生成

1、VOC2007数据集简介

想制作自己的数据集当然要先了解SSD使用的数据集VOC2007长啥样。
（VOC2007完整下载有3个压缩包+1个PDF，上面链接里只包含其中一个压缩包VOCtrainval_06-Nov-2007）。打开压缩包就如下图：
在这里插入图片描述
VOC2007详细介绍在这里，提供给大家有兴趣作了解。而制作自己的数据集只需用到前三个文件夹，所以请事先建好这三个文件夹放入同一文件夹内，同时ImageSets文件夹内包含Main文件夹

JPEGImages：用于存放训练、测试的图片（图片格式最好为.jpg）
Annotations：用于存放.xml格式的文件，也就是图片对应的标签，每个.xml文件都对应于JPEGImages文件夹的一张图片
ImageSets：内含Main文件夹，在…/ImageSets/Main文件夹下包含test.txt、train.txt、val.txt、trainval.txt四个文件，生成的方式第二步有详细说明

2、制作自己的数据集

第一步：下载图片，存入JPEGImages文件夹——你可以直接从各种渠道下载得到所需要的图片集，存入到JPEGImages文件夹下，命名格式统一为“00xxxx.jpg”，如下图：

在这里插入图片描述

第二步：使用labelImg工具给图片打标签——这是最重要的一步。如果你的python已经pip install lxml下载了lxml，就可以直接在我网盘下载* labelImg工具windows版使用，密码：gyf3。
通过以上网盘下载得到工具文件后，打开…/data/predefined_classes.txt文件，可以发现这里都是图片标签——把你将要用到的标签都事先存入在这里，注意标签不能有中文。每次使用都把.exe、data这两个文件拖到桌面上（如果直接在文件夹内运行.exe会报错不能运行），打开labelImg.exe文件，运行界面如下：就可以开始给图片打标签了
在这里插入图片描述

labelImg工具简单的使用步骤就是：

打开单个文件，或者打开一个图片文件夹
给目标物体建立box边框
对box边框内的物体贴上标签
把一张图片内所有目标物都打上各自标签后，再保存生成.xml文件，注意存入Annotations文件夹，文件名也要与当前图片保存一致
然后next下一张图片继续打标签，直到所有图片内物体都打上了标签，最后exit

第三步：生成Main文件夹下的.txt文件——在主目录下运行以下代码既可生成test.txt、train.txt、val.txt、trainval.txt四个文件，请注意每一个path地址是否正确（其实这四个txt文件在后续并没有什么用处）

# -*- coding：utf-8 -*-
# -*- author：zzZ_CMing  CSDN address:https://blog.csdn.net/zzZ_CMing
# -*- 2018/07/18; 15:19
# -*- python3.5
import os  
import random  

trainval_percent = 0.7  
train_percent = 0.8
xmlfilepath = 'Annotations/'
txtsavepath = 'ImageSets/Main'  
total_xml = os.listdir(xmlfilepath)  

num = len(total_xml)  
list = range(num)  
tv = int(num*trainval_percent)  
tr = int(tv*train_percent)  
trainval = random.sample(list,tv)  
train = random.sample(trainval,tr)  

ftrainval = open(txtsavepath+'/trainval.txt', 'w')  
ftest = open(txtsavepath+'/test.txt', 'w')  
ftrain = open(txtsavepath+'/train.txt', 'w')  
fval = open(txtsavepath+'/val.txt', 'w')  

for i in list:  
    name = total_xml[i][:-4]+'\n'  
    if i in trainval:  
        ftrainval.write(name)  
        if i in train:  
            ftrain.write(name)  
        else:  
            fval.write(name)  
    else:  
        ftest.write(name)  

ftrainval.close()  
ftrain.close()  
fval.close()  
ftest .close()
print('Well Done！！！')