py-faster-rcnn + ZF 实现自己的数据训练与检测(二)

最新推荐文章于 2018-12-18 16:57:17 发布

置顶

csuwujiyang

最新推荐文章于 2018-12-18 16:57:17 发布

阅读量7.5k

点赞数

分类专栏： caffe实践深度学习人脸识别文章标签： faster-rcnn 脸部识别

本文链接：https://blog.csdn.net/u013078356/article/details/50987845

版权

本文档详细介绍了如何使用py-faster-rcnn框架，结合ZF网络，制作并训练人脸识别数据集。从创建XML标注文件，生成训练和测试所需的txt文档，到修改prototxt配置文件避免训练错误，以及最终模型的训练和测试过程，提供了一站式的解决方案。

摘要由CSDN通过智能技术生成

0.前言

在前面的一篇博客中，介绍了如何实现py-faster-rcnn的配置以及在PASCAL VOC 2007上面的训练，本节，来讲诉如何制作并训练自己的数据集。如果自己使用的是matlab版本的faster rcnn的话，请移步这里：http://blog.csdn.net/sinat_30071459/article/details/50546891

1.制作自己的数据集

训练模型最头疼的估计就是数据集的整理与标记了，本例中我以人脸识别为例来说明数据集的安排。首先，这里为了方便，我没有更改VOC2007的任何格式，只是将data/VOCdevkit2007/VOC2007/Annotations和ImageSets以及JPEGImages文件夹的内容进行了替换。假设你的数据集已经进行了标记，所做的标记框已经输出到txt文档中，如下所示。

0001.jpg f 67 55 195 201
0001.jpg f 339 49 479 206

从左到右依次是图片名称，打框的标签和框的4个坐标

然后是将文档中的数据写入xml文件，如何制作数据可以参考这篇文章http://blog.csdn.net/liumaolincycle/article/details/50540487，这里不在赘述。不过和它不同的是，我为了方便，依然使用原有的数据集名称，只是对相应的文件进行了替换。最后是生成4个txt文档，分别为train.txt trainval.txt test.txt 和 val.txt。据我发现，在实验时好像只用到了trainval.txt和test.txt，他们两个构成完整的一个数据集。最后，可以将原有的一些SegmenttationClass和SegmentationObject等文件夹删除，在我的实验中，所需要的完整结构如下所示。