使用SSD模型检测教学场景下的“举手”目标

本文详述了使用SSD模型在教学场景下进行‘举手’目标检测的过程。项目中已有R-FCN方案,但通过对比,SSD在检全率和准确率上并未展现出优势。文章详细记录了SSD的配置、训练、调试步骤,包括数据预处理、模型训练和测试,并分析了SSD在小物体检测上的局限性,最后得出结论:在特定场景下,R-FCN的表现优于SSD。
摘要由CSDN通过智能技术生成

由于项目需求,最近花了约三周的时间,尝试在我们自己的教学场景数据集上,完成SSD目标检测模型的测试,检测目标只有一个类别:举手(Handraising)。实际上,项目中已经存在可以完成举手目标检测的方案R-FCN,所以目的是为了验证SSD是否会有检测效果和检测速度的提升,这里简要记录一下整个流程,尽管之后在测试数据集上,SSD的检全率和准确率并不比R-FCN更好。

一、背景介绍:

SSD Single Shot MultiBox Detector )是 2016 出来的一篇目标检测的文章,实际比 R-FCN 稍早一些。在该文中,作者指出他们提出的新方法比之前的目标检测方法都要好 ( 准确率、检测速度两个方面都有优势 ) ,结果统计如下图

截止到SSD发布,它应该是最优的目标检测算法,之后同年公布的R-FCN也表现出几乎相同的检测准确率,但并未与SSD作比较。到了现在,物体检测方面最优的方法应该要算YOLO v2,下面是近些年出现的一些物体检测算法列表:

PS:总结主要来自博客

http://blog.csdn.net/hx921123/article/details/55804685?locationNum=3&fps=1

DPM(时间 2008

Adiscriminatively trained, multiscale, deformable part model

OverFeat(时间 2013

OverFeat:Integrated Recognition, Localization and Detection using Convolutional Networks

SPP-Net(时间 2015

Spatial PyramidPooling in Deep Convolutional Networks for Visual Recognition

DeepID-Net(时间 2014

DeepID-Net:Deformable Deep Convolutional Neural Networks for Object Detection

RCNN(时间 2014

Rich featurehierarchies for accurate object detection and semantic segmentation

Fast RCNN(时间 2015

Fast R-CNN

Faster RCNN(时间 2015

Faster R-CNN towards real-time object detection with region proposalnetworks

R-FCN(时间 2016

R-FCN Object Detection via Region-based Fully Convolutional Networks

Yolo(时间 2016

You Only Look Once - Unified, Real-Time Object Detection

SSD(时间 2016

SSD Single Shot MultiBox Detector

Yolo v2(时间 2016

YOLO9000 - Better, Faster, Stronger

Mask R-CNN(时间 2017

Mask R-CNN

……

可以看到,物体检测算法层出不穷,让人应接不暇,这里只选取SSD物体检测算法来进行总结,理论分析部分不再讨论,详细记述模型使用过程。

二、SSD配置及调试步骤:

源码网址:https://github.com/weiliu89/caffe/tree/ssd

其实github上已经给出了详细使用步骤,这里再重复一遍,同时就自己遇到的一些问题给出解决办法。

这里按照该网址提供的步骤来记录

1Installation

2Preparation

3Train/Eval

4Models

1Installation

1)首先是下载源码并安装,选择将其放在自己的某个文件夹下

git clone https://github.com/weiliu89/caffe.git

cd caffe

git checkout ssd

(出现分支则说明copy-check成功...作者caffe目录下有三个分支fcn/master/ssd, 利用git checkout来切换分支,否则只有master目录下的文件)

2)之后需要编译源码

# Modify Makefile.config according to your Caffe installation.

cp Makefile.config.example Makefile.config 

#这里需要根据电脑具体的配置修改Makefile.config

make -j8

# Make sure to include $CAFFE_ROOT/python to your PYTHONPATH.

make py

make test -j8

# (Optional)

make runtest -j8

编译过程中,只要配置好了caffe所需要的文件,一般不会出现什么问题

 

2Preparation

1)下载已经训练好的VGGNet16模型,fullyconvolutional reduced (atrous) VGGNet,确认将其放在$CAFFE_ROOT/models/VGGNet/ 目录下

网址中提供的链接不可用,这里使用网上搜到的预训练模型

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值