一、组成
VOC数据集包括三个必要的文件,分别是JPEGImages、ImageSets和Annotations。
JPEGImages储存所有的训练图片,而Annotations里面应该存储每张图片对应的xml文件(需要做标签)
ImageSets里面有个Main文件夹,其中存储trainval.txt记录每一个训练图片的文件名
(可以自己书写py代码通过xml文件名生成对应的txt,代码在文末)
即目录结构为:
-VOCdataset
--Annotations
---文件.xml
--ImageSets
---Main
----trainval.txt
--JPEGImages
---训练图片.jpg
二、制作标签(win10环境下)
制作标签需要用到一个软件。https://github.com/tzutalin/labelImg 。
下载到本地的文件夹之后,通过右键+shift打开Powershell界面。
注:LabelImg需安装Qt5(python3)或者Qt4(python2)(pip3 install python-qt5)
分别输入
pyrcc5 -o resources.py resources.qrc
python labelImg.py
打开界面之后:
open dir 选择数据集文件的路径(不能含有中文)
change save dir