背景说明:本次训练的模型分五类,分别为['whiteboard','chair','diningtable','sofa','tvmonitor']。训练数据集大约1000张。模型转为pd格式大小约240M,每帧检测需要约250ms,即4fps。
环境:Window 10 系统,python=3.6,tensorflow=1.15 。
整个项目下载路径:https://pan.baidu.com/s/1uZbdJQEyeSfxTlXR-fQ24g 提取码:bq9u
一、数据准备
1.用Labelimg标注好图像训练集,放在D:/AI\yolov3_whiteboard/data/dataset_whiteboard/Annotations, 里面是已经标注好的XML文件。还没安装Labelimg图像标注工具的请点击安装。原始图像放在D:/AI/yolov3_whiteboard/data/dataset_whiteboard/JPEGImages/train文件中。
2.把XML文件的内容转为txt文本并保存。运行D:/AI/yolov3_whiteboard/scripts/take_xml_to_train.py即可,这里说明一下几个参数: