目标检测性能指标

Dylan_TAI

于 2024-07-20 16:06:11 发布

阅读量554

点赞数 17

文章标签： deep learning 目标检测计算机视觉

本文链接：https://blog.csdn.net/Dylan_TAI/article/details/131858229

版权

1、关于TP、FP、FN、TN

TP正确且预测为正	FP错误且预测为正（虚警）
FN错误且预测为负（漏检）	TF正确且预测为负

对角线：预测正确；反对角线：预测错误

准确率：

准确率 $= \frac{TP+TN}{TP+TN+FP+FN}$

精确率：（实际为正 && 判断为正） / 判断为正 ，又叫查准率，看查得准不准

精确率 $= \frac{TP}{TP+FP}$

召回率：（实际为正 && 判断为正） / 实际为正，又叫查全率，看查得全不全（看似和精确率是倒数关系，实际不然，从集合交并的角度考虑）

召回率 $= \frac{TP}{TP+FN}$

2、PR曲线

PR曲线：反映模型在不同的置信度阈值下，精确度和召回率之间的关系。

PR曲线的绘制：通过改变分类器的阈值，计算不同阈值下的精确率和召回率，绘制曲线。

具体而言：

设置不同的置信度阈值，就会筛选出不同数量的预测框，从而TP、FP的数量也会不同（只有置信度高于给定置信度阈值的预测框，才会纳入TP、FP的统计范围），进而得到不同的精确度和召回率，这就是一个精确度对应多个召回率，以及一个召回率对应多个精确度的原因。

从曲线上看，刚开始时，设置的置信度阈值较高，得到的精确度就高，但是可能存在大量漏检，所以召回率低；在最后，置信度阈值设置的比较低，不容易发生漏检，进而召回率较高，但是存在大量的虚警（FP），因此精度较低。

过程中，会涉及到两个阈值，一个是置信度阈值、一个是IOU阈值。

置信度阈值：用来筛选出哪些预测框将被纳入TP、FP的统计范围

IOU阈值：用来确定预测框是不是TP

举个例子：

假设一张图片当中恰有5个苹果，但是在对该图片进行目标检测时，一共得到了10个类别标签是苹果的锚框。那么怎么去获取该锚框的真实label，也就是它实际上是不是一个苹果？

方法是计算模型预测出来的锚框和人工标注的锚框(称之为Groud Truth，真实值)的交并比，如果交并比超过0.5，那么认为该预测是正确的，即实际上该锚框框起来的是一个苹果。但是在实际预测当中，经常会出现多个预测锚框跟同一个GT(Groud Truth)的IoU值都大于0.5，这个时候只将这些预测框中置信度最大的算是一个苹果，其他不算苹果（非极大值抑制）。

precision和recall的值都在0和1之间，不同的置信度阈值可能会计算出相同的recall或者precision，也就是说，一个recall可能对应多个precision，或者一个precision对应多个recall，所以PR曲线类似下图

Precision Recall Curve

我们称之为PR曲线下面积 PR-AUC(Area Under Curve)

3. AP

定义：AP是在不同的召回率下计算得到的精确度的平均值。

抛出个疑问：为什么不是不同精确度下计算得到的召回率的平均值呢？

召回率是一个覆盖面的度量，它表示了模型发现正实例的比例，它涵盖了从未检测出正类实例（召回率为0）到检测出所有正类实例（召回率为1）之间的所有情况。这种全面覆盖使得它成为衡量模型整体检测性能的基础。

如果在不同的精确度下计算召回率的平均值，则：精确度受负类样本影响较大：精确度的计算不仅涉及正类样本，还涉及负类样本，而召回率专注于正类样本。对于目标检测任务，尤其是当负类样本数量远大于正类样本时，使用召回率可以避免负类样本对评估结果的过大影响。