7.目标检测

目标检测算法分类

在这里插入图片描述
在这里插入图片描述

目标检测的任务

分类原理

在这里插入图片描述

分类的损失与优化

在这里插入图片描述
在这里插入图片描述
对于目标检测来说不仅仅是分类这样简单的一个图片输出一个结果,而且还需要输出图片中目标的位置信息,所以从分类到检测,如下图标记了过程

检测的任务

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

目标定位的简单实现思路

**在分类的时候我们直接输出各个类别的概率,如果加上定位的话,我们可以考虑在 网络的最后输出加上位置信息。(增加一段全连接输出4个位置,做损失计算)**

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

两种Bounding box名称

在这里插入图片描述
在这里插入图片描述

R-CNN与SPPNet

在这里插入图片描述

目标检测-Overfeat模型

滑动窗口

在这里插入图片描述
在这里插入图片描述
这种方法类似一种暴力穷举的方法,会消耗大量的计算力量,并且由于窗口大小问题可能会造成效果不佳,但是提供了一种解决目标检测问题的思路。

R-CNN模型

在这里插入图片描述
在这里插入图片描述

  • 候选区域(Region of Interest)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • CNN网络提取特征
    在这里插入图片描述
  • 特征向量训练分类器SVM
    在这里插入图片描述
    每个SVM分类器做的事情,判断2000个候选区域是某类别,还是背景
  • 非最大抑制(NMS)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • 修正候选区域
    在这里插入图片描述
    在这里插入图片描述
  • 检测的评价指标
    IOU交并比
    在这里插入图片描述

在这里插入图片描述
平均精确率(mean average precision)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 流程总结
    输入图片
    在这里插入图片描述
    找出图片中可能存在目标的候选区域region proposal
    在这里插入图片描述
    将候选区域调整为适应AlexNet网络的输入图像的大小227227,通过CNN对候选区域提取特征向量,2000个建议框的CNN特征组合成网络AlexNet最终输出:20004096维矩阵
    在这里插入图片描述
    将2000
    4096维特征经过SVM分类器(20种分类,SVM是二分类器,则有20个SVM),获得200020种类别矩阵。
    分别对2000
    20维矩阵中进行非极大值抑制(NMS:non-maximum suppression)提出重叠建议框,得到与目标物体最高的一些建议框
    在这里插入图片描述
    修正bbox,对bbox做回归微调在这里插入图片描述
  • 优缺点

在这里插入图片描述
在这里插入图片描述

SPPNet

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 映射
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • spp

在这里插入图片描述
在这里插入图片描述

  • 总结

在这里插入图片描述
在这里插入图片描述

Fast R-CNN

在这里插入图片描述

  • 改进的地方
    在这里插入图片描述
  • Rol pooling
    在这里插入图片描述
    在这里插入图片描述
  • End-to-End model

在这里插入图片描述

  • 多任务损失-Multi-task loss
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

R-CNN、SPPNet、Fast R-CNN对别

在这里插入图片描述

Faster R-CNN

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • RPN原理
    在这里插入图片描述

anchors(窗口)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • Faster RCNN训练
    在这里插入图片描述
    在这里插入图片描述
  • 候选区域训练
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

开源的keras Faster RCNN模型

https://github.com/jinfagang/keras_frcnn

  • 环境
    在这里插入图片描述
  • 代码结构
    在这里插入图片描述

YOLO(You only look once)

在这里插入图片描述
可以看出YOLO的最大特点是速度快

结构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 单元格(grid cell)
    在这里插入图片描述
  • 网格输出筛选
    在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

  • 非最大抑制(NMS)
    在这里插入图片描述
  • 训练
    在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

与Faster R-CNN比较

在这里插入图片描述

总结

在这里插入图片描述

SSD(Single Shot MultiBox Detector)

在这里插入图片描述

原理结构

  • 结构

在这里插入图片描述

  • 流程

在这里插入图片描述

  • Detectr&classifier
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • PriorBox层-default boxes
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • localization与confidence
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

训练与测试过程

  • 训练流程
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

  • 测试流程
    在这里插入图片描述
    在这里插入图片描述
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值