模型评估指标_精准率、召回率、F1-score、ROC曲线、AUC曲线

PuJiang-

已于 2022-11-15 19:51:44 修改

阅读量3.4k

点赞数

分类专栏：深度学习理论基础文章标签：深度学习

于 2022-05-05 12:51:13 首次发布

本文链接：https://blog.csdn.net/jump882/article/details/124583868

版权

16 篇文章 3 订阅

订阅专栏

一、分类结果混淆矩阵

在这里插入图片描述

P(Positive)、N(Negative)针对的是预测值的结果。
P表示对样本的预测结果为正例，
N表示对样本的预测结果为反例。
T(True)、F(False)针对的是预测值的结果是否预测对了。
TP表示对该样本预测结果为正例，同时预测对了，真实标签和预测标签都为正例，
FP表示对该样本预测结果为正例，但是预测错了，真实标签为反例，预测标签为正例，
TN表示对该样本预测结果为反例，同时预测对了，真是标签和预测标签都为反例，
FN表示对该样本预测结果为反例，但是预测错了，真实标签为正例，预测标签为反例。

在这里插入图片描述

在这里插入图片描述

准确率，指的是正确预测的样本数占总预测样本数的比值，它不考虑预测的样本是正例还是负例，反映的是模型算法整体性能。
$A=\frac{TP+TN}{TP+FP+FN+TN}$

精准率，指的是正确预测的正样本数占所有预测为正样本的数量的比值，也就是说所有预测为正样本的样本中有多少是真正的正样本，它只关注正样本。
$P=\frac{TP}{TP+FP}$

召回率，指的是正确预测的正样本数占真实正样本总数的比值，也就是指能从这些预测样本中能够正确找出多少个正样本。
$R=\frac{TP}{TP+FN}$

F1-score，被定义为精确率和召回率的调和平均数。
$F_1=\frac{2*P*R}{P+R}$

横轴是召回率，纵轴是精准率。二者的值矛盾且统一，通常精准率高时，召回率往往偏低，召回率高时，精准率往往偏低。
图片来源：机器学习，周志华
衡量模型A、B、C性能
1、A曲线完全包住C曲线、B曲线完全包住C曲线。说明A、B两个模型无论在精准率还是召回率都优于C模型，所以A、B两个模型优于C模型。
2、A、B两条曲线有交叉部分
1）计算A、B曲线与坐标轴之间围成的面积，但这个值不太好估算。
2）平衡点(Break-Even Point)，精准率等于召回率时的取值。由此可得A模型优于B模型。
3）优于平衡点衡量标准过于简单，更常使用的就是F1-score。
精准率、召回率关系
在某些实际场景中，对精准率和召回率的重视程度不相同。
比如疾病诊断，大多数情况下真实标签中没病的很多，有病的很少。如果判断时把所有病例都判断为无病，精准率同样会很高，但召回率极低。这个时候需要重点关注召回率这个指标。

在这里插入图片描述

横轴是假正例率，纵轴是真正例率。
左上角代表真正率高，假正率低。模型效果更好。
图片来源：https://baike.sogou.com/v472808.htm;jsessionid=2C527CDD2A1BFE2BAB595A696A676FB9

[1] 《机器学习》周志华
[2] 《百面机器学习》诸葛越、葫芦娃

关注