1.获取faster-rcnn源码。
github官方下载连接:https://github.com/endernewton/tf-faster-rcnn
2.配置环境
python3.6 、 tensorflow1.13
使用pip install -r requirements.txt
,直接下载所需依赖
3.添加预训练模型
下载vgg16模型,并且保存在路径:./data/imagenet_weights中,命名为vgg16.ckpt
4.数据集格式
数据集存放路径.\data\VOCdevkit2007\VOC2007
数据集如图所示:
其中Annotations存放.xml标注文件,Imagesets存放数据集划分文件,JPEGImages存放图片。其中Annotations与JPEGImages中文件名称一一对应。Imagesets中的文件可通过如下代码自动划分:
import os
import random
trainval_percent = 0.95 #训练集占比
train_percent = 0.95
xmlfilepath = 'data/Annotations' #此处路径修改为你的本地路径
txtsavepath = 'data/ImageSets'
total_xml = os.listdir(xmlfilepath