结合上一章内容,本章节将结合实际需要,使用Tensorflow Object Detection API从头训练符合自己需求的图和表的检测分类模型.
需求说明:输入拍摄的文本页面图片,目标是训练一个可以正确检测图片上的图和表格并在图片画出其bounding box,之前用yolo也做过检测,不过效果不太好,会出现检测不准确甚至漏检情况,于是这次想尝试api的检测效果,模型使用ssd_mobilenet_v2.
1,训练数据准备:
因为之前用yolo做过检测,所以训练数据都放在一个文件夹下,另外还有一个.txt文件,.txt文件包含了图片路径,图标的bounding box及对应的类别,如图:
每行分别代表图片路径 xmin ymin xmax ymax label(0代表graph, 1代表table),一张图片可能有多个图表,所以每一行图片可能有多个xmin ymin xmax ymax label.我分别有两个这样的.txt文件,一个是训练集,一个是测