1、lst文件格式(手动生成)
目标检测除了类别,还有对应的四个坐标,对应的lst文件格式如下:
# I A B C D ~ id xmin ymin xmax ymax id xmin ymin xmax ymax ~ im_path
#I索引;A表示Header的长度(即ABCD长度),至少是 2;B表示每个bbox记录长度,C,D,…可选,
#表示存储的一些额外信息,一般C会表示样本 width,D表示样本 Height;id 表示该 bbox 所属的类别id;xmin,ymin,xmax,ymax表示bbox左上角和右下角的点坐标,且被归一化到[0,1]
3 4 5 500 333 6.0 0.312 0.2912912912912913 0.702 0.8108108108108109 ..\Dataset\VOC2007_set\000012.jpg
4 4 5 334 500 1.0 0.2754491017964072 0.144 0.9131736526946108 0.946 ..\Dataset\VOC2007_set\000016.jpg
2、创建文件夹:(参照利用mxnet生成rec文件(图像分类)_FTT_XXX的博客-CSDN博客)
区别是这里使用:
python im2rec.p