二.每周一学------目标检测入门

前言

目前计算机视觉(CV,computer vision)与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为人工智能(AI,artificial intelligence)·机器学习(ML,machine learning)·深度学习(DL,deep learning)方向的三大热点方向 。

计算机视觉又分为三个基本内容

  • 一是分类(Classification),即是将图像结构化为某一类别的信息,用事先确定好的类别(string)或实例ID来描述图片(这是解决“what”)。
    -二是检测(Detection),分类任务关心整体,给出的是整张图片的内容描述,而检测则关注特定的物体目标,要求同时获得这一目标的类别信息和位置信息。相比分类,检测给出的是对图片前景和背景的理解。(这是解决“what和where”)。
  • 三是分割(Segmentation)。分割包括语义分割(semantic segmentation)和实例分割(instance segmentation),前者是对前背景分离的拓展,要求分离开具有不同语义的图像部分,而后者是检测任务的拓展,要求描述出目标的轮廓,相比检测框更为精细。
    在这里插入图片描述

今天我们主要讲的是关于目标检测的一些内容

目标检测简述

目标检测定义: 简答来说包含两个子任务
一是输出这一目标的类别信息,属于分类任务
二是输出目标的具体位置信息,属于定位任务

目标检测的问题:

  • 目标种类与数量的问题
  • 目标的尺度问题
  • 外在环境的干扰问题

目标检测的发展历程

  1. 传统的目标检测方法
  2. 以R-CNN为代表的结合region proposal和CNN分类的目标检测框架(R-CNN, SPP-NET, Fast R-CNN, Faster R-CNN, R-FCN)
  3. 以YOLO为代表的将目标检测转换为回归问题的端到端(End-to-End)的目标检测框架(YOLO, SSD)

在这里插入图片描述
而上图我们发现算法分为单阶段(One-stage)和双阶段(Two-stage)
在这里插入图片描述
总之,完成目标检测都会遵循3个步骤

  • 选择检测窗口
  • 提取图像特征
  • 设计分类器

检测窗口的选择
目标检测的最终任务是检测出一个窗口中是否有物体
最简单窗口滑动法(这种会产生大量无效的窗口)

特征提取

  • Haar特征提取速度快,能够表达物体多个方向的边缘变化信息
  • LBP特征采用中心像素和边缘像素的灰度对比,可以表达物体丰富的纹理信息,是传统人脸检测算法中广泛应用的纹理特征
  • HOG特征通过对物体边缘进行直方图统计,通常应用于物体检测

分类器

  • Adaboost
  • SVM
  • 决策树和随机森林

有兴趣的同学可以自行了解

传统的目标检测方法

在这里插入图片描述
以下是几种传统的目标检测算法(同学们可自行去了解,其实我也不懂,嘿嘿)

  • Viola-jones
  • HOG+SVM
  • DPM

传统目标检测存在的两个主要问题:

  • 一是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;
  • 二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。

下次我们将对深度学习的目标检测更深入的了解,谢谢大家的观看!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值