学习总结--混淆矩阵、准确率、精确率、召回率、PR曲线、mAP

先记一些概念

准确率

检测时分对的样本数除以所有的样本数。准确率一般被用来评估检测模型的全局准确程度,包含的信息有限,不能完全评价一个模型性能。

解释:例如,我们在模型推理阶段,输出特别多的边界框(即把预测时的score调的非常低),也不管这些框是否包含目标,那么最后算出来的acc毫无疑问会非常的高,但是这又有什么用那,因为预测的框大部分都是错误的

混淆矩阵

混淆矩阵(Confusion Matrix)是以模型预测的类别数量统计信息为横轴,真实标签的数量统计信息为纵轴画出的矩阵。对角线代表了模型预测和数据标签一致的数目,所以准确率也可以用混淆矩阵对角线之和除以测试集图片数量来计算(对于分类来说)。对角线上的数字越大越好,在混淆矩阵可视化结果中颜色越深,代表模型在该类的预测结果更好。其他地方自然是预测错误的地方,自然值越小,颜色越浅说明模型预测的更好。
在这里插入图片描述
在这个混淆矩阵中实际有 8只猫,但是系统将其中3只预测成了狗;对于 6条狗,其中有 1条被预测成了兔子,2条被预测成了猫。所有正确的预测结果都在对角线上,所以从混淆矩阵中可以很方便直观的看出哪里有错误,因为他们呈现在对角线外面。

在讲精确率和召回率之前先有如下假设:

假设你的分类系统最终的目的是:能取出测试集中所有飞机的图片,而不是大雁的图片。然后就可以定
义:
一True positives:简称为TP,即正样本被正确识别为正样本,飞机的图片被正确的识别成了飞机。
一True negatives:简称为TN,即负样本被正确识别为负样本,大雁的图片没有被识别出来,系统正确地
认为它们是大雁。
一False Positives:简称为FP,即负样本被错误识别为正样本,大雁的图片被错误地识别成了飞机。
一False negatives:简称为FN,即正样本被错误识别为负样本,飞机的图片没有被识别出来,系统错误地 认为它们是大雁。

精确率

精确率就是在识别出来的图片中,True positives所占的比率。也就是本假设中机中,所有被识别出来是飞机中,真正的飞机所占的比例。即 Precision=TP/(TP+FP)(TP+FP)理解为所有被认为是正样本的数目,这样好理解。

召回率

召回率是测试集中所有正样本样例中,被正确识别为正样本的比例。也就是本假设中,被正确识别出
来的飞机个数与测试集中所有真实飞机的个数的比值,公式如下:Recall =TP/(TP+FN)****,(TP+FN)理解为正样本的总量。
值得注意的是,其中precision和recall是此消彼长的关系
下面这个图片可能会更好理解precision和recall这2个指标的区别。
在这里插入图片描述

mAP

在目标检测中,我们不仅要判断出目标所属类别,还要判断出目标的位置,VOC数据集是以pred_bbox的与GT_BBOX的IoU>0.5来计算mAP的,详细的计算方法见这里
COCO数据集目标检测评价指标中,用AP0.5:0.95:0.05来表示。与voc评价指标所不同的就是,选择从0.5到0.95且以0.05为步幅的10个iou阈值下的ap求平均的方法。
但是在比赛中,赛题方一般都会自己设定几个阈值来计算map。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值