写在前面:首先,你安装了ssd,并测试了VOC数据
*********************************************************
第一部分:数据准备(任务繁重)
1.标数据(生成的bounding box是txt格式),标数据的工具:链接:https://pan.baidu.com/s/1dvOXkW3xJtm9g4jR-3ZDhQ 密码:7eqr
2.将txt格式转化为VOC格式,代码链接:https://download.csdn.net/download/yu734390853/10274930
3.在/home/$你的服务器命/data/VOCdevkit下建立自己的数据集名称(以我的为例,我建立的是MyDataSet),在MyDataSet目录下需包含Annotations、ImageSets、JPEGImages三个文件夹:
Annotations目录下存放第二步生成的xml格式数据文件。
ImageSet目录下包含Main文件下,在ImageSets\Main里有四个txt文件:test.txt train.txt trainval.txt val.txt;
生成这四个txt文件的代码如下(Python)(根据自己的路径修改):
import os
import random
trainval_percent = 0.66
train_percent = 0.5
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)
num=len(total_xml)
list=range(num)
tv=int(num*trainval_percent)