首先第一步要做的显然是安装python和tensorflow开发环境,这里不再详述,可以参考其他博文,建议使用Anaconda安装,使用起来很方便。下面开始介绍如何配置faster RCNN环境。
1.首先,下载源程序,这里使用 https://github.com/dBeker/Faster-RCNN-TensorFlow-Python3 的源代码:
直接使用git拷贝到指定文件夹
git clone https://github.com/dBeker/Faster-RCNN-TensorFlow-Python3
2.安装需要的几个python开发包:
pip install cython
pip install python-opencv
pip install easydict
若python-opencv无法安装,可以在链接https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/opencv-python/下载对应版本安装包,我这里下载的是 opencv_python-3.3.1.11-cp35-cp35m-win_amd64.whl,然后在 anaconda指令窗口输入 :
pip install opencv_python-3.3.1.11-cp35-cp35m-win_amd64.whl
安装开发包,对于其他未找到的安装包亦可采用此方法进行安装(在https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/找即可,亦可直接输入https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/XXX/若存在对应开发包的安装包则直接可以找到,其中XXX为开发包名字)。
3. 在anaconda命令窗口,进入Faster-RCNN-TensorFlow-Python3\data\coco\PythonAPI目录,执行编译指令以及安装指令:
python setup.py build_ext --inplace
python setup.py build_ext install
然后进入另一个目录Faster-RCNN-TensorFlow-Python3\lib\utils,执行编译指令:
python setup.py build_ext --inplace
这里极容易出现的问题是会出现报错:building 'pycocotools._mask' extension error: Unable to find vcvarsall.bat,有很多解决方法,最直接的方法就是安装VS2015,其实,这个问题说白了就是没有Visual C++ 编译环境,解决办法就是安装编译环境(等于没说)。(这里使用的是微软COCO图像库相关API,可参看 https://github.com/philferriere/cocoapi)我认为相对简单的方法是安装VisualCppBuildTools_Full.exe,相对于安装VS2015要简单许多,也会省很多空间。网上可以搜到,也可以在我的微云下载https://share.weiyun.com/5yfO6Rr-g。
4.下载VOC2007数据集:
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar
将三个压缩文件解压到Faster-RCNN-TensorFlow-Python3\data文件夹下,得到一个名为VOCdevkit的文件夹,将起名字改为VOCDevkit2007。
5.下载vgg16已训练好的网络模型数据到Faster-RCNN-TensorFlow-Python3\data\imagenet_weights\vgg16.ckpt,imagenet_weights原本不存在需要自己创建,vgg16.ckpt下载地址为
http://download.tensorflow.org/models/vgg_16_2016_08_28.tar.gz
这里注意默认下载文件名字为vgg_16.ckpt,需要手动改为vgg16.ckpt否则会出错,后续文章会对此进行详述,亦可以选择其他网络模型,对应下载地址为:
https://github.com/tensorflow/models/tree/master/research/slim#pre-trained-models
但注意若采用其他模型需要修改相关文件,后续会有介绍,我们在这里先默认使用vgg16。
6.在Faster-RCNN-TensorFlow-Python3文件夹下执行
python train.py 开始训练。
7.在文件夹Faster-RCNN-TensorFlow-Python3\default\voc_2007_trainval\default可以看到训练好的保存模型文件。
这是整个windows环境下的训练模型的整个搭建过程,后续文章将对具体内容进行更详细的分析。