记录下mobilnet-ssd如何跑自己的数据集。默认环境已经配置好,并且demo.py已经可以成功运行了。
mobilenet-ssd下载路径(需要注意的点:需要以Git的方式下载,不要以zip的方式下载,否则后面训练时可能报错)
$ git clone https://github.com/chuanqi305/MobileNet-SSD.git
步骤记录:1、制作VOC数据集
2、用create_data.sh 和create_list.sh生成lmdb库
3、创建labelmap.prototxt文件
4、运行gen_model.sh脚本
5、修改数据集的路径
6、运行train.sh
以下对上述步骤进行详细的说明。
一、建立适用于SSD训练的数据集(VOC格式)
- 图片的标注和重命名
图片的标注可以用labelImage来做,源代码来自GitHub, 使用前需要安装各种环境,很复杂。直接下载打包好的也是要配置一些环境的。 也可以用一个VOC2007样本制作工具。
https://github.com/tzutalin/labelImg https://pan.baidu.com/s/1aQy3JJ7xgFS10gCXR36FvA#list/path=%2F
https://pan.baidu.com/s/1aQy3JJ7xgFS10gCXR36FvA#list/path=%2F
图片需要命名成这种格式:
2、 VOC格式数据集中用到的主要是下面三个文件夹:
Annotations: 存放图片标记后生成的.xml文件
JPEGImages:存放原始图片(.jpg)
ImageSets:里面建立一个Main文件夹,包含几个.txt文件,内容是图片的编号(只要写入文件名就可以,不用地址,不用后缀,四个文件的生成方式见备注)
备注:
a)如果图像的标注信息是写在.txt文件中的(如