一、 faster rcnn安装
首先是完成faster rcnn 的配置并运行,用tensorflow配置并运行Faster-RCNN,配置好笔记本的环境,下载好各个需要用到的库。
大致配置步骤如下:
1.下载并安装好cuda和cudnn,我的笔记本是windows版本的,下载好的tensorflow版本是1.5.0,对应要安装的cuda版本是9.0。同时cudnn的版本要是7.0.5才行,不然到最后运行测试时会出很多错。
2.安装vs2015,这些vs2015,cuda之类的安装包都是用的同学的,所以省了很多事。然后在vs2015中编译cuda项目,这些在网上都有教程,最终编译结果如下图所示,则代表cuda安装成功了。
3.安装Anaconda3,之前我都是用的清华镜像,但现在已经停用了,官网那边也不会再更新其他版本了,所以这个安装包也是用的同学的。Anaconda安装成功后在直接在Anoconda Prompt里面进入conda环境,然后在conda环境中一个个安装相应的库,我因为重装了一次系统,电脑里面的环境都很干净,所以这次配置出的问题都不是很大,短时间内就能解决。最麻烦的两个就是tensorflow-gpu和pycocotools的安装,这两个库的安装前者是需要网络好和运气好,后者就是要通过不断的踩坑最后才能成功安装好。Pycocotools是因为之前根本就没有windows的官方版本,但之后又有大佬写了一个windows可用的版本,所以直接用pip install pycocotools根本行不通,需要下载一个git,然后用pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI才能行,在这个过程中实在是有很多麻烦的问题,要慢慢的在网上找解决方法才行。
4. 所有库都成功安装上以后,开始测试代码的时候又突然出错了,python在运行过程中突然中断,在后面发现是我的cudnn版本跟cuda版本不对应的问题,我也不知道自己的cudnn版本怎么是7.17,之后在官网下载了7.05的版本并安装好终于就能成功运行了。
5.最后就是训练过程可视化软件pycharm的安装了,用这个软件打开Faster-RCNN的文件夹,直接运行其中的代码,就能很直观的看到训练过程和训练结果了,也很方便修改代码和查找错误。
二、 faster rcnn训练
通过看博客慢慢熟悉faster rcnn训练流程,我使用的是传统的faster rcnn,训练基本流程就是:
1.制作PASCAL VOC2007格式的数据集
制作数据集的方法很多博客上都有,但是真正自己制作的时候仍然会遇到很多问题,其中最麻烦的是把自己的数据图像和标签转换成标准的voc2007格式,通过一段时间的学习找到了一个xml_make.py的代码,可直接将自己的数据集转换成标准格式,这样就能直接用我自己的代码训练了。
2.训练模型
模型的训练只需要运行train.py文件就行了,按自己情况修改训练迭代次数,训练好之后模型会保存在cache文件夹下。
3.结果检测
现在才训练一次,遇到的问题还比较多。最开始测试的时候测试结果本来应该是直接显示出来的,但不知道什么原因结果并没有显示。通过看博客找到了一个可以直接将结果写入文件夹的方法,就是如图注释掉plt.show(),加一行写入文件的代码:plt.savefig(“data/testfigs/” + im_name),这样测试结果就直接保存在自己建立的文件夹中了。