最近学习了解到这个框架,自我感觉使用起来较为简单,官方开源的版本是基于mxnet实现的。
目标检测,跟踪,reid,gan里面都有相关网络样例github地址:https://github.com/dmlc/gluon-cv
官方教程给的都是voc数据集的教程,这边记录一下训练自己的数据集以及使用自己训练的模型进行预测的一个教程,进行记录。(faster-rcnn)
一 、环境部署
1. Python安装
建议安装Anaconda即可。需要:Python 2.7/3.5
2. 环境安装
pip install gluoncv --upgrade
pip install mxnet-mkl --upgrade
# if cuda 10.1 is installed
pip install mxnet-cu101mkl --upgrade
opencv
等需要的安装包运行的时候提示报错,直接pip install xxx
即可。
二 、Faster-RCNN 训练详情
训练集就制作成VOC数据集,之后修改该部分代码(按照自己的数据集目录以及文件夹名修改):
if dataset.lower() == 'voc':
train_dataset = gdata.VOCDetection(
splits=[(2007, 'trainval'), (2012, 'trainval')])
val_dataset = gdata.VOCDetection(
splits=[(2007, 'test')])
val_metric = VOC07MApMetric(iou_thresh=0.5, class_names=val_dataset.classes)
直接进入到faster-rcnn的目录,项目中的目录如下:gluon-cv-master/scripts/detection/faster_rcnn
python train_faster_rcnn.py --gpus 0,1 --network resnet50_v1b
其中:resnet50_v1b
为你选择的backbone
。
执行上面的命令之后即可训练,模型默认保存到运行目录下,可以设置保存路径。
三 、Faster-RCNN 预测详情
backbone_name 为训练时选择的backbone,model_name为训练之后保存的模型名称:
python demo_faster_rcnn.py --network backbone_name --pretrained model_name