Object Detection 1

最新推荐文章于 2024-08-25 08:42:46 发布

__Miracle__

最新推荐文章于 2024-08-25 08:42:46 发布

阅读量131

点赞数 1

分类专栏：深度学习文章标签：目标检测计算机视觉人工智能

原文链接：https://www.baidu.com/

版权

深度学习专栏收录该内容

17 篇文章 18 订阅

订阅专栏

本文介绍了目标检测的基本概念，包括其在人脸识别、行人检测和自动驾驶等领域的应用。重点讲述了目标检测的两类算法：两步式（如R-CNN系列）和端到端（如YOLO、SSD）。IoU作为衡量检测精度的标准被详细阐述，同时提出了目标定位的简单实现方法，通过结合分类和位置信息的损失函数进行训练。此外，还讨论了目标检测在不同场景下的关键作用，如车辆检测和医学影像分析。

摘要由CSDN通过智能技术生成

目标检测概述

学习目标

了解目标检测算法分类
知道目标检测的常见指标IoU
了解目标定位的简单实现方式

什么是目标检测

目标检测（Object Detection）的任务是找出图像中所有感兴趣的目标（物体），确定它们的类别和位置。
例子：确定某张给定图像中是否存在给定类别（比如人、车、自行车、狗和猫）的目标实例；如果存在，就返回每个目标实例的空间位置和覆盖范围。作为图像理解和计算机视觉的基石，目标检测是解决分割、场景理解、目标追踪、图像描述、事件检测和活动识别等更复杂更高层次的视觉任务的基础。

目标检测的应用场景
目标检测具有巨大的实用价值和应用前景。

应用领域包括人脸检测、行人检测、车辆检测、卫星图像中道路的检测、车载摄像机图像中的障碍物检测、医学影像在的病灶检测等。

应用场景包括长/视频领域、医学场景、安防领域、自动驾驶等等众多领域

行人车辆检测：
在这里插入图片描述
多人脸的检测:

目标检测的实用价值

这里我们举一些使用的场景

在视频中去进行检测明星人物，检测出某明星的视频只看他的视频。类似在爱奇艺中的只看他功能快速筛选仅有明星出现的片段。
在这里插入图片描述

目标检测算法介绍

在这里插入图片描述

在这里插入图片描述
下面这张图代表了目标检测算法的发展历史（基于深度学习），其中红色部分是影响较大的算法论文。需要大家着重了解的

在这里插入图片描述

算法分类

两步走的目标检测：先进行区域推荐，而后进行目标分类
包含一个用于区域提议的预处理步骤，使得整体流程是两级式的。代表：R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN和R-FCN等
端到端的目标检测：直接在网络中提取特征来预测物体分类和位置
即无区域提议的框架，这是一种单独提出的方法，不会将检测提议分开，使得整个流程是单级式的。代表：OverFeat、YOLOv1、YOLOv2、YOLOv3、SSD和RetinaNet等

在这里插入图片描述

目标检测的任务

分类的任务回顾

分类的损失与优化
在训练的时候需要计算每个样本的损失，那么CNN做分类的时候使用softmax函数计算结果，损失为交叉熵损失

在这里插入图片描述

常见CNN模型

对于目标检测来说不仅仅是分类这样简单的一个图片输出一个结果，而且还需要输出图片中目标的位置信息，所以从分类到检测，如下图标记了过程:
分类:
目标检测
什么是IoU(Intersection over Union)
IoU是一种测量在特定数据集中检测相应物体准确度的一个标准。IoU是一个简单的测量标准，只要是在输出中得出一个预测范围(bounding boxex)的任务都可以用IoU来进行测量。为了可以使IoU用于测量任意大小形状的物体检测，我们需要：

ground-truth bounding boxes（人为在训练集图像中标出要检测物体的大概范围）
我们的算法得出的结果范围。
也就是说，这个标准用于测量真实和预测之间的相关度，相关度越高，该值越高。如下图所示。绿色标线是人为标记的正确结果（ground-truth），红色标线是算法预测的结果（predicted）。

IoU的计算
IoU是两个区域重叠的部分除以两个区域的集合部分得出的结果，通过设定的阈值，与这个IoU计算结果比较。

在这里插入图片描述

目标定位的简单实现思路

在分类的时候我们直接输出各个类别的概率，如果再加上定位的话，我们可以考虑在网络的最后输出加上位置信息。下面我们考虑图中只有一个物体的检测时候，我们可以有以下方法去进行训练我们的模型

回归位置

增加一个全连接层，即为FC1、FC2

FC1：作为类别的输出
FC2：作为这个物体位置数值的输出

假设有10个类别，输出[p1,p2,p3,…,p10]，然后输出这一个对象的四个位置信息[x,y,w,h]。同理知道要网络输出什么，如果衡量整个网络的损失
对于分类的概率，还是使用交叉熵损失
位置信息具体的数值，可使用MSE均方误差损失（L2损失）

如下图所示
在这里插入图片描述

两种Bounding box名称

在目标检测当中，对bbox主要由两种类别。

Ground-truth bounding box：图片当中真实标记的框
Predicted bounding box：预测的时候标记的框

一般在目标检测当中，我们预测的框有可能很多个，真实框GT也有很多个。

在这里插入图片描述

目标检测在很多领域都有应用需求，包括人脸检测，行人检测，车辆检测以及遥感影像中的重要地物检测等。

人脸检测

人脸检测是人脸识别应用中重要的一个环节，主要用于确定人脸在图像中的大小和位置，即解决“人脸在哪里”的问题，把真正的人脸区域从图像中裁剪出来，便于后续的人脸特征分析和识别

行人检测
行人检测具有极其广泛的应用：智能辅助驾驶，智能监控，行人分析以及智能机器人等领域。此外，其在视频监控，人流量统计，自动驾驶中都有重要的地位。特征提取、形变处理、遮挡处理、分类是四个行人检测中的重要部分。
车辆检测
车辆检测在智能交通，视频监控，自动驾驶中有重要的地位。车流量统计，车辆违章的自动分析等都离不开它，在自动驾驶中，首先要解决的问题就是确定道路在哪里，周围有哪些车、人或障碍物。

此外，交通标志如交通灯、行驶规则标志的识别对于自动驾驶也非常重要，我们需要根据红绿灯状态，是否允许左右转、掉头等标志确定车辆的行为。同时，医学影像图像如MRI的肿瘤等病变部位检测和识别对于诊断的自动化，提供优质的治疗具有重要的意义。还有工业中材质表面的缺陷检测，硬刷电路板表面的缺陷检测等

总结

掌握目标检测的算法分类
掌握分类，分类与定位，目标检测的区别
掌握分类与定位的简单方法、损失衡量

__Miracle__

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Object Detection 1

目标检测概述学习目标了解目标检测算法分类知道目标检测的常见指标IoU了解目标定位的简单实现方式什么是目标检测目标检测（Object Detection）的任务是找出图像中所有感兴趣的目标（物体），确定它们的类别和位置。例子：确定某张给定图像中是否存在给定类别（比如人、车、自行车、狗和猫）的目标实例；如果存在，就返回每个目标实例的空间位置和覆盖范围。作为图像理解和计算机视觉的基石，目标检测是解决分割、场景理解、目标追踪、图像描述、事件检测和活动识别等更复杂更高层次的视觉任务的基础。目标检测
复制链接

扫一扫

专栏目录