目标检测常遇概念解释

最新推荐文章于 2022-10-08 18:46:28 发布

几里路遥

最新推荐文章于 2022-10-08 18:46:28 发布

阅读量808

点赞数 1

分类专栏：目标检测文章标签： NMS ROI IoU mAP FPS

本文链接：https://blog.csdn.net/qjt19950610/article/details/102837353

版权

目标检测专栏收录该内容

2 篇文章 0 订阅

订阅专栏

开题准备

1 DPM

DPM算法采用了改进后的HOG特征，SVM分类器和滑动窗口（Sliding Windows）检测思想，针对目标的多视角问题，采用了多组件（Component）的策略，针对目标本身的形变问题，采用了基于图结构（Pictorial Structure）的部件模型策略。此外，将样本的所属的模型类别，部件模型的位置等作为潜变量（Latent Variable），采用多示例学习（Multiple-instance Learning）来自动确定。

2 mAP

平均精度均值（mAP）是预测目标位置以及类别的这一类算法的性能度量标准。mAP 对于评估目标定位模型、目标检测模型以及实例分割模型非常有用。

在模型预测时，输出的 bounding box 是有很多的，但是大部分都是置信度很小的，我们只需要输出置信度超过某个阈值的 bounding box 。

TP —— True Positive （真正, TP）是指某（些）个正样本被预测判定为正；此种情况可以称作判断为真的正确情况【correctly identified】。

TN —— True Negative（真负 , TN）是指某（些）个负样本被预测判定为负；此种情况可以称作判断为假的正确情况【correctly rejected】。

FP ——False Positive （假正, FP）是指某（些）个负样本被模型预测为正；此种情况可以称作判断为真的错误情况，或称为误报【incorrectly identified】。

FN——False Negative（假负 , FN）是指某（些）个正样本被模型预测为负；此种情况可以称作判断为假的错误情况，或称为漏报【incorrectly rejected】。

准确率和召回率是互相影响的，因为如果想要提高准确率就会把预测的置信率阈值调高，所有置信率较高的预测才会被显示出来，而那一些正确正预测（True Positive）可能因为置信率比较低而没有被显示了。一般情况下准确率高、召回率就低，召回率低、准确率高，如果两者都低，就是网络出问题了。

一般来说影响 mAP 的原因有很多，主要有以下几个：

1. 不好的训练数据。

2. 训练数据不够多。

3. 标注的框不准确。

4. 数据的多变性。

有的时候增加训练数据可能 mAP 并不会增加多少。当然了，使用表现更好的网络，其 mAP 自然地也会更加的高。

3 IoU

IoU 的全称为交并比（Intersection over Union）。IoU 计算的是 “预测的边框” 和 “真实的边框” 的交集和并集的比值。

4 Dropout layer

dropout layer的目的是为了防止CNN 过拟合, 在训练过程中，将神经网络进行采样，也就是随机的让神经元激活值为0，而在测试时不再采用dropout。通常设置随机采样概率为0.5，也可以通过验证集来确定采样概率。

1.**前向传播**

训练阶段：前向传播给定每个神经元一个随机值（0~1），假定设置采样阈值为0.5，如果该神经元对应的随机值小于0.5，则设置该神经元为0，否则设置该神经元值为2乘以原值，（1/0.5），并把所有神经元对应的随机值保存下来，在后向传播是需要使用。

测试阶段：无需dropout。

2.**反向传播**

读取在前向传播记录的随机值，同样的操作：该梯度值对应的随机值小于0.5，则设置该梯度值为0，否则设置该梯度值为2乘以原值，（1/0.5）。

5 NMS

非极大值抑制，简称为NMS算法，英文为Non-Maximum Suppression。其思想是搜素局部最大值，抑制极大值。

目标检测的过程中在同一目标的位置上会产生大量的候选框，这些候选框相互之间可能会有重叠，此时我们需要利用非极大值抑制找到最佳的目标边界框，消除冗余的边界框。

左图是人脸检测的候选框结果，每个边界框有一个置信度得分(confidence score)，如果不使用非极大值抑制，就会有多个候选框出现。右图是使用非极大值抑制之后的结果，符合我们人脸检测的预期结果。

5.1 如何使用非极大值抑制

前提：目标边界框列表及其对应的置信度得分列表，设定阈值，阈值用来删除重叠较大的边界框。 IoU：intersection-over-union，即两个边界框的交集部分除以它们的并集。

非极大值抑制的流程如下：

· 根据置信度得分进行排序

· 选择置信度最高的边界框添加到最终输出列表中，将其从边界框列表中删除

· 计算所有边界框的面积

· 计算置信度最高的边界框与其它候选框的IoU

· 删除IoU大于阈值的边界框

· 重复上述过程，直至边界框列表为空。

6 FPS

FPS(frame per second)是图像领域中的定义，是指画面每秒传输帧数，通俗来讲就是指动画或视频的画面数。FPS是测量用于保存、显示动态视频的信息数量。每秒钟帧数愈多，所显示的动作就会愈流畅。通常，要避免动作不流畅的最低是30。

7 Background false positive

假设在一个单类别检测问题中的样本有两类（背景算1类）。Background false positive就是把background错误检测为正样本框的数量。

8 ROI

ROI（region of interest），感兴趣区域。机器视觉、图像处理中，从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域，称为感兴趣区域，ROI。

在图像处理领域，感兴趣区域(ROI) 是从图像中选择的一个图像区域，这个区域是你的图像分析所关注的重点。圈定该区域以便进行进一步处理。使用ROI圈定你想读的目标，可以减少处理时间，增加精度。

几里路遥

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
目标检测常遇概念解释

开题准备1 DPMDPM算法采用了改进后的HOG特征，SVM分类器和滑动窗口（Sliding Windows）检测思想，针对目标的多视角问题，采用了多组件（Component）的策略，针对目标本身的形变问题，采用了基于图结构（Pictorial Structure）的部件模型策略。此外，将样本的所属的模型类别，部件模型的位置等作为潜变量（Latent Variable），采用多示例学习（M...
复制链接

扫一扫