混淆矩阵、召回率、精确率、正确率、F1、真阳性率、假阳性率、ROC、AUC

Hayden112

已于 2022-03-28 18:16:46 修改

阅读量3.2k

点赞数 4

分类专栏：机器学习文章标签： confusionmatrix 召回率精确率 ROC AUC

于 2020-10-21 19:25:59 首次发布

本文链接：https://blog.csdn.net/weixin_42432468/article/details/109207810

版权

9 篇文章 0 订阅

订阅专栏

$C o n f u s i o n M a t r i x :$

召回率 $\dfrac{TP}{TP + FN}$ ，关注真实情况，关注positive。“好瓜被挑出来的概率”

精确率 $\dfrac{TP}{TP + FP}$ ，关注预测情况，关注positive。“挑出来的瓜有多少真的是好瓜”

正确率 $\dfrac{TP + TN}{TP + FN + FP + TN}\quad$ ，positive与negative预测的准确性

$F$ 值：
$\dfrac{\beta^2 +1}{F} = \dfrac{\beta^2}{R} + \dfrac{1}{P}$

真阳性率TPR，又可称为灵敏度，关注真实情况，关注positive, $\dfrac{TP}{TP + FN}$ 。
灵敏度：正例被挑出的概率。如果一项诊断试验的灵敏度比较低，那么会出现很多假阴性的患者。这会延误患者的就诊，影响病程发展和愈后，甚至导致患者过早死亡。

假阳性率FPR，又等于1-特异度，关注真实情况，关注negative, $\dfrac{FP}{FP + TN}$ 。
特异度：负例被挑出的概率。如果一项诊断试验的特异度比较低，那么会出现很多假阳性的患者。这样会浪费医疗资源、造成患者无端的恐慌和焦虑。

当选择不同的threshold时， $T P R 、 F P R$ 值会随之变化，遍历所有的threshold后，会得到一系列的 $T P R 、 F P R$ ，用 $T P R$ 作为 $Y$ 轴，用 $F P R$ 作为 $X$ 轴，即得到 $R O C$ 。
在这里插入图片描述

$R O C$ 主要作用:

AUC就是ROC曲线下的面积，衡量学习器优劣的一种性能指标。

在风控中，我们常用KS指标来评估模型的区分度（discrimination）

$\max(|TPR-FPR|)$
即ROC曲线切线位置。

关注