0.前言
因为我用的是tensorflow的环境,所以Rbg的官方代码我是没有用的,采用的是github上tensorflow实现的faster rcnn,网址为:https://github.com/endernewton/tf-faster-rcnn
这个版本主要也是参考faster rcnn的官网代码写的,和官方版本大同小异,很适合用tf的人。如果github上下不下来,可以下载我自己保存的版本:https://pan.baidu.com/s/1oAcbRT4
1.准备数据
- 首先建议把tf-faster-rcnn的代码下下来之后,根据作者github上的提示测试一下代码,确保是能跑通的;
- 因为我用的是vgg16作为feature extractor,所以先下载在imagenet上预训练好的vgg16模型,放在data/imagenet_weight目录下;
- 在data目录下新建自己的数据目录,以我的为例,建立了Dianli目录,然后在Dianli目录下新建annotations_cache、results、以及VOC2010目录,如果觉得繁琐,可以直接下载我保存的tf-faster-rcnn代码,所有的目录基本都建好的,只需要根据自己的需求做相