自己之前用的模型在准确性以及实时性方面没有达到一个很好的均衡,在大佬同学的介绍下,开始转向Retinanet。
1.运行环境
运行环境:Windows10操作系统,python3.6(通过anaconda安装),tensorflow1.10,keras2.2.4。
2.数据预览
主要参考github上一篇介绍文档:https://github.com/fizyr/keras-retinanet,建议对说明文档多看几遍。retinanet模型训练的数据是按照VOC2007格式进行。首先看一下最后数据集文件夹以及数据格式预览:(.record和.pbtxt文件可以忽略,这是Google tensorflow API训练模型时用到的文件,与retinanet无关。)
其中:.csv文件是由voc2csv.py产生,generator_voc.py用来产生ImageSets中的文件。
Annotation文件夹如下:
Annotation文件里时格式为.xml的标注文件,注意文件名字以及文件数量和JPEGImages文件夹里的图片保持一致。 ImageSet文件夹下有一个Main文件夹,里面有四个文件:
Main文件夹需要自己创建,剩余的四个txt文件由代码自动生成。
3.数据制作
在数据制作时,特别感谢这两篇博客的作者:
https://blog.csdn.net/u012426298/article/details/80450537
https://blog.csdn.net/u012426298/article/details/80334292
3.1制作数据前提:JPEGImages文件夹里自己训练的图片,对图片进行标注的.xml文件夹Annotation