目标检测评价指标（查准率 precision，查全率recall，PR曲线，AP，MAP，交并比iou，置信度，NMS）

最新推荐文章于 2024-04-12 14:04:32 发布

cv吴彦祖

最新推荐文章于 2024-04-12 14:04:32 发布

阅读量1.4k

点赞数

分类专栏：目标检测机器学习文章标签：深度学习机器学习人工智能

本文链接：https://blog.csdn.net/wangjia2575525474/article/details/120351122

版权

机器学习同时被 2 个专栏收录

8 篇文章 5 订阅

订阅专栏

目标检测

6 篇文章 1 订阅

订阅专栏

作者：阿凿
链接：https://www.zhihu.com/question/53405779/answer/429585383
来源：知乎

查准率 precision，查全率recall，PR曲线，AP，MAP

明确问题: 大背景是object detection，我就以正在学的RetinaNet应用背景为例，识别出来的每一个框都有N+1个score，对应着N个class和1个background，我们会选score最高的那个作为最终的判断基本定义: precision和recall的含义， preicision是在你认为的正样本中，有多大比例真的是正样本， recall则是在真正的正样本中，有多少被你找到了。问题核心: 我们需要一个对于score的threshold, 为什么呢? 比如在一个bounding box里，我识别出来鸭子的score最高，可是他也只有0.1，那么他真的是鸭子吗？很可能他还是负样本。所以我们需要一个阈值，如果识别出了鸭子而且分数大于这个阈值才真的说他是正样本，否则他是负样本那么threshold到底是怎么影响precision和recall的呢？我们还是用鸭子的例子如果threshold太高， prediction非常严格，所以我们认为是鸭子的基本都是鸭子，precision就高了；但也因为筛选太严格，我们也放过了一些score比较低的鸭子，所以recall就低了如果threshold太低，什么都会被当成鸭子， precision就会很低， recall就会很高这样我们就明确了threshold确实对鸭子的precision和recall产生影响和变化的趋势，也就带来了思考， precision不是一个绝对的东西，而是相对threshold而改变的东西， recall同理，那么单个用precision来作为标准判断，就不合适。这是一场precision与recall之间的trade off，用一组固定值表述不够全面，因为我们根据不同的threshold，可以取到不同（也可能相同）的precision recall值。这样想的话对于每个threshold，我们都有（precision， recall）的pair，也就有了precision和recall之间的curve关系有了这么一条precision-recall curve，他衡量着两个有价值的判断标准， precision和recall的关系，那么不如两个一起动态考虑，就有了鸭子这个class的Average Precision，即curve下的面积，他可以充分的表示在这个model中， precision和recall的总体优劣。最后，我们计算每个class的Average Precision，就得到了mean Average Precision

置信度：

分类置信度confidence是介于0和1(或100%)之间的数字，它描述模型认为此预测边界框包含某类别目标的概率，一般多分类的话，最后一层输出接softmax函数，会输出n个前景和1个背景的概率分数，预测框属于哪一类看哪个的分数最高

交并比IOU

在这里插入图片描述

NMS非极大抑制

在用训练好的模型进行测试时，网络会预测出一系列的候选框。这时候我们会用NMS来移除一些多余的候选框。即移除一些IOU值大于某个阈值的框。然后在剩下的候选框中，分别计算与ground truth的IOU值，通常会规定当候选框和ground truth的IOU值大于0.5时，

cv吴彦祖

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
目标检测评价指标（查准率 precision，查全率recall，PR曲线，AP，MAP，交并比iou，置信度，NMS）

作者：阿凿链接：https://www.zhihu.com/question/53405779/answer/429585383来源：知乎查准率 precision，查全率recall，PR曲线，AP，MAP明确问题: 大背景是object detection，我就以正在学的RetinaNet应用背景为例，识别出来的每一个框都有N+1个score，对应着N个class和1个background，我们会选score最高的那个作为最终的判断基本定义: precision和recall的含义， p
复制链接

扫一扫