环境:VS2013,CUDA8.0,CuDNN 5.0,Win10
前提:已正确搭建Faster RCNN运行环境,成功运行Demo。教程可见这篇文章。
一、准备工作
1. 下载VOC2007数据集
下载地址:
官网:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/,同时下载训练集+测试集
或者http://academictorrents.com/details/c9db37df1eb2e549220dc19f70f60f7786d067d4
或者别人提供的网盘:https://pan.baidu.com/s/1mhMKKw4
下载完成后,解压至py-faster-rcnn\data路径下,并将文件夹名称改为:VOCdevkit2007,如图:
这样我们就可以使用VOC2007的数据组织形式完成训练了。其中:
VOCdevkit2007/VOC2007/JPEGImages里是训练&测试数据图片
VOCdevkit2007/VOC2007/Annotations里是对图片的标注,XML格式,即说明图片的哪一坐标范围内是哪一类物体
VOCdevkit2007/VOC2007/ImageSets/Main里的txt记录了哪些图片是作为训练or测试使用
2.(非必要)下载预训练模型
地址:https://dl.dropboxusercontent.com/s/o6ii098bu51d139/faster_rcnn_models.tgz
如果想利用Finetune技术重新训练模型什么的,可以进行下载。不然可以跳过。
3.移动之前build的文件
将py-faster-rcnn\lib\build\lib.win-amd64-2.7下的三个文件夹,复制到py-faster-rcnn\lib下。
二、训练VOC2007
我们可以先通过VOC2007的数据练练手,默认程序的训练参数是基于它的,所以不需要改什么地方就能够进行训练。希望尝试用自己数据训练的可以跳至下节。
1.训练模型
我们使用end2end的形式进行训练,CMD打开至py-faster-rcnn目录下,运行如下命令:
SET VS90COMNTOOLS=%VS120COMNTOOLS%
python .\tools\train_net.py --gpu 0 --solver .\models\pascal_voc