使用SSD模型检测教学场景下的“举手”目标

最新推荐文章于 2024-08-12 14:50:42 发布

zhy_csdn

最新推荐文章于 2024-08-12 14:50:42 发布

阅读量1.7k

点赞数 2

分类专栏： Machine Learning Object Detection Caffe

本文链接：https://blog.csdn.net/zhy_csdn/article/details/79292931

版权

本文详述了使用SSD模型在教学场景下进行‘举手’目标检测的过程。项目中已有R-FCN方案，但通过对比，SSD在检全率和准确率上并未展现出优势。文章详细记录了SSD的配置、训练、调试步骤，包括数据预处理、模型训练和测试，并分析了SSD在小物体检测上的局限性，最后得出结论：在特定场景下，R-FCN的表现优于SSD。

摘要由CSDN通过智能技术生成

由于项目需求，最近花了约三周的时间，尝试在我们自己的教学场景数据集上，完成SSD目标检测模型的测试，检测目标只有一个类别：举手(Handraising)。实际上，项目中已经存在可以完成举手目标检测的方案R-FCN，所以目的是为了验证SSD是否会有检测效果和检测速度的提升，这里简要记录一下整个流程，尽管之后在测试数据集上，SSD的检全率和准确率并不比R-FCN更好。

一、背景介绍：

SSD （ Single Shot MultiBox Detector ）是 2016 出来的一篇目标检测的文章，实际比 R-FCN 稍早一些。在该文中，作者指出他们提出的新方法比之前的目标检测方法都要好 ( 准确率、检测速度两个方面都有优势 ) ，结果统计如下图

截止到SSD发布，它应该是最优的目标检测算法，之后同年公布的R-FCN也表现出几乎相同的检测准确率，但并未与SSD作比较。到了现在，物体检测方面最优的方法应该要算YOLO v2，下面是近些年出现的一些物体检测算法列表：

PS：总结主要来自博客

http://blog.csdn.net/hx921123/article/details/55804685?locationNum=3&fps=1

DPM（时间 2008）

Adiscriminatively trained, multiscale, deformable part model

OverFeat（时间 2013）

OverFeat:Integrated Recognition, Localization and Detection using Convolutional Networks

SPP-Net（时间 2015）

Spatial PyramidPooling in Deep Convolutional Networks for Visual Recognition

DeepID-Net（时间 2014）

DeepID-Net:Deformable Deep Convolutional Neural Networks for Object Detection

RCNN（时间 2014）

Rich featurehierarchies for accurate object detection and semantic segmentation

Fast RCNN（时间 2015）

Fast R-CNN

Faster RCNN（时间 2015）

Faster R-CNN towards real-time object detection with region proposalnetworks

R-FCN（时间 2016）

R-FCN Object Detection via Region-based Fully Convolutional Networks

Yolo（时间 2016）

You Only Look Once - Unified, Real-Time Object Detection

SSD（时间 2016）

SSD Single Shot MultiBox Detector

Yolo v2（时间 2016）

YOLO9000 - Better, Faster, Stronger

Mask R-CNN（时间 2017）

Mask R-CNN

……

可以看到，物体检测算法层出不穷，让人应接不暇，这里只选取SSD物体检测算法来进行总结，理论分析部分不再讨论，详细记述模型使用过程。

二、SSD配置及调试步骤：

源码网址：https://github.com/weiliu89/caffe/tree/ssd

其实github上已经给出了详细使用步骤，这里再重复一遍，同时就自己遇到的一些问题给出解决办法。

这里按照该网址提供的步骤来记录

1、Installation

2、Preparation

3、Train/Eval

4、Models

1、Installation

1）首先是下载源码并安装，选择将其放在自己的某个文件夹下

git clone https://github.com/weiliu89/caffe.git

cd caffe

git checkout ssd

（出现“分支”则说明copy-check成功...作者caffe目录下有三个分支fcn/master/ssd, 利用git checkout来切换分支，否则只有master目录下的文件）

2）之后需要编译源码

# Modify Makefile.config according to your Caffe installation.

cp Makefile.config.example Makefile.config

#这里需要根据电脑具体的配置修改Makefile.config

make -j8

# Make sure to include $CAFFE_ROOT/python to your PYTHONPATH.

make py

make test -j8

# (Optional)

make runtest -j8

编译过程中，只要配置好了caffe所需要的文件，一般不会出现什么问题

2、Preparation

1）下载已经训练好的VGGNet16模型，fullyconvolutional reduced (atrous) VGGNet，确认将其放在$CAFFE_ROOT/models/VGGNet/ 目录下

网址中提供的链接不可用，这里使用网上搜到的预训练模型

最低0.47元/天解锁文章

zhy_csdn

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录