最近在做毕业设计,需要用到faster rcnn,训练数据使用的是我自己下载的imageNet里的部分数据,主要用到了其中的bike,motorbike,car,bus,train等交通工具。由于imageNet自带了annotation,只是格式和pascal voc不一样,所以还需要转化格式。目前我正在使用imageNet中的ship数据集来进行一个二分类的检测和识别,即background和ship。等这个实验成功之后再进行其他类别的数据转换并进行多类的训练。本文主要记录在进行这个实验时候自己所做的一些工作和查阅资料所获得的帮助,相关参考链接也会在文中贴出来。目前网络还在训练中,结果未知,先将已做的一些工作记录,以供以后自己和大家参考,后续再更新。
我的开发环境是Ubuntu14.04,caffe是必须先要配置好的,这里就不再赘述,网上很多教程。进行该实验之前需要先配置py-faster-rcnn工程,具体参考原作者的github项目(https://github.com/rbgirshick/py-faster-rcnn),写得很清楚,另外该算法还有一个matlab版本(https://github.com/ShaoqingRen/faster_rcnn),要想直接看中文可以参考这一篇博客(http://blog.csdn.net/samylee/article/details/51086153)
运行成功demo.py之后,我们还需要做的是下载pascal voc的数据集,对它进行训练。在项目的github网站也给出了训练的方法,这一步个人感觉必须得做,因为我们后续训练自己的imageNet数据的时候也是模仿pascal voc2007的数据集的格式来的。具体步骤参考原作者的github项目(https://github.com/rbgirshick/py-faster-rcnn),或者博客(http://blog.csdn.net/samylee/article/details/51099508),个人感觉最好看原作者的比较好,道理很简单,谁做的肯定就是谁最清楚怎么回事。
经过以上的参考,配置好py-faster-rcnn并在pascal voc 2007数据集上训练成功应该不成问题。下面讲述如何利用imageNet的某一类数据进行训练。
=======================================我是华丽丽的分割线=================