常用的评估指标

准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1-score

在这里插入图片描述
TP, FP, FN, TN所组成的2x2矩阵即为混淆矩阵(Confusion matrix)
注意sklearn.metrics.confusion_matrix()得到混淆矩阵的形状为(区别于上图)
[[TN FP]
[FN TP]]

特异性(specificity, SP) ,即预测为负类的正确率

在这里插入图片描述

召回率(Recall) = 真正率(true positive rate, TPR) = 灵敏度(sensitivity, SE)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

=TP/正类样本数

假正率(false positive rate, FPR) = 1-特异度

在这里插入图片描述

=FP/负类样本数

ROC曲线

ROC是以FPR为x轴,TPR为y轴得到的曲线。
从FPR和TPR的定义可以理解,俩分母固定,为负、正类样本数;俩分子之和也固定(同一阈值),为预测为正的样本数。但注意不能说TP越大,FP越小,也不是说TPR越大,FPR越小。因为这些值都已经在阈值确定的情况下固定下来了。正确的表述应该是,我们想要得到更优的模型,应该让TPR尽可能大,FPR尽可能小。还要注意FPR和TPR的和不是1。
过程可参考
在这里插入图片描述
在这里插入图片描述

AUC值(Area Under Curve)

AUC表示曲线下方的面积。(ROC和PR只是一条曲线,而AUC是一个数值,数值可以更好的对模型进行量化,所以在评价模型的时候通常会使用AUC进行比较。)
在这里插入图片描述

对于ROC曲线来说,AUC的值越大(即曲线越靠近左上角),说明模型越优(随着阈值的降低,在召回率增大的同时依旧能够保持很小的错误率)。
对于PR曲线来说,我们希望Recall和Precision同时越大越好,所以PR曲线越靠近右上角说明模型越优。

PR曲线

以Recall为x轴,Precision为y轴得到的曲线。
一个阈值对应一个混淆矩阵,也对应一个FPR、TPR、Recall、Precision,所以可以说每一个ROC曲线都有唯一的一个PR曲线与之对应。

在这里插入图片描述
ROC曲线和PR曲线更进一步的关系:在ROC中若曲线L1高于L2,则在PR中L1也高于L2,反之成立。具体可参考
关于sklearn.metrics.precision_recall_curve()函数返回的precision和 recall最后对应的1和0没有对应的阈值,以及关于函数如何选择阈值步长等问题,可参考。此外若使用np.trapz()计算面积时记得将precision和 recall进行np.fliplr()翻转,防止计算得到负的AUC值。

平均精度(Average-Precision,AP)与 mean Average Precision(mAP)

PR曲线除了与ROC曲线一样有个AUC指标外,还有一个AP指标表示PR曲线下面的面积,两者有些许区别,AUC计算面积使用梯形块分割,AP使用矩阵块分割。
  AP计算可用sklearn.metrics.average_precision_score(y, pred)
  AUC_PR的计算可用sklearn.metrics.auc(recall, precision)或np.trapz(precision, recall)【两者结果相同】
  通常来说一个越好的分类器,AP值也越高。
  mAP是多个类别AP的平均值。这个mean的意思是对每个类的AP再求平均,得到的就是mAP的值,mAP的大小一定在[0,1]区间,越大越好。该指标是目标检测算法中最重要的一个。
  在正样本非常少的情况下,PR表现的效果会更好。

ROC和PR的适用场景

Recall与TPR等价。当FP值不同的时候,Precision值更能够反映出模型之间的差异
ROC曲线:对正负两类同样关心
PR曲线:对正类更加关心
当正负样本数量差距极大时,ROC曲线不敏感,所以要用PR曲线。但同时也揭示了ROC的一个优点,当样本数量变化时,ROC具有稳定性。
具体可参考

IoU:重叠度(Intersection of Union)

IoU这一值,可以理解为系统预测出来的框与原来图片中标记的框的重合程度。 计算方法即检测结果Detection Result与 Ground Truth 的交集比上它们的并集,即为检测的准确率。
在这里插入图片描述

Dice相似系数(Dice Similariy Coefficient,DSC)【与F1-score相同】

Dice系数是一种集合相似度度量指标,通常用于计算两个样本的相似度,值的范围 0-1 ,分割结果最好时值为 1 ,最差时值为 0.
在这里插入图片描述

Jaccard相似系数(Jaccard index / Jaccard similarity coefficient,JI / JSC)

Jaccard index, 又称为Jaccard相似系数(Jaccard similarity coefficient)用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值