提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
本文章是基于已有的Faster Rcnn代码完成的对E字符的四种形态进行画框识别。
一、制作自己的数据集
1、图片获取
可以百度获得差不多20多张E的图片,然后再对这些图片进行旋转、翻转等操作获得一个较大的数据集(具体多大没有规定)。
2、进行标注
可以利用标注工具labelimg对图片进行标注,可以得到一个.xml文件夹,其中的数据就是对图片的标注信息,便于后续的训练模型。
3、制作数据集
在Faster Rcnn代码中的数据集格式是VOC2007的格式,
Annotations里面存储的就是标注数据的文件,JPEGImages里面存储的是对应的图片,而下载的代码中有一个部分,运行可以生成ImageSets里的Main的东西。
二、训练自己的目标监测网络与利用自己的模型进行预测
1.需要更改多个地方的地址,分类等。例如图片大小,以及各种地址分类等。
2.利用训练好的权值文件,更改model_path与classes_path的地址,还要在classes_path中更改分类。
三、具体的步骤
可以在B站观看Bubbliiiing的基于pytorch实现Faster Rcnn的视频
视频讲的非常清楚,我一个初学者也能很快理解。
地址:https://www.bilibili.com/video/BV1BK41157Vs?from=search&seid=5716594295222086544
代码也是在该博主的gittub上面下载的。