VOC数据集主要结构
- VOCdevkit
- VOC2019
- Annotations
- ImageSets
- Main
- Layout
- Segmentation
- JPEGImages
- SegmwntationClass
- SegmwntationsObject
- VOC2019
其中, 最主要的文件就是以上加粗的文件夹。
Annotations 放置JPEGImages文件夹下图片的标注文件(.xml文件)
JPEGImages下放你要去训练和测试模型的所有图片
Main文件夹下是生成
val.txt
train.txt
test.txt
trainval.txt
四个文件的
注意事项:
图片不能有大写字母, 并且数字保持6位
接下来对图片名字进行批处理
在JPEGImages文件夹下打开终端
输入dir /b>a.xls
生成a.xls文件
第一列为你原来目录下所有文件的名字(此处包括a.xls, 所以在a.xls文件中记得删去)
在旁边列(即B列)第一行 输入你将要更改的文件名(如我的是000001.jpg), 右下角下拉。
在旁边列(即C列) 输入="ren “&A1&” "&B1 (空格别忘了), 然后下拉。
然后在文件夹新建一个 txt文件, 复制刚才a.xls文件中生成的C列粘贴进去, 然后重命名为a.bat, 执行a.bat。
修改xml文件
import xml.dom.minidom
imp