分类模型常用评价指标——混淆矩阵和roc曲线

最新推荐文章于 2024-05-27 18:54:38 发布

Chaoying.

最新推荐文章于 2024-05-27 18:54:38 发布

阅读量2.1k

点赞数 1

分类专栏：机器学习文章标签：分类机器学习算法

本文链接：https://blog.csdn.net/TJLCY/article/details/122110744

版权

机器学习专栏收录该内容

9 篇文章 1 订阅

订阅专栏

混淆矩阵

在这里插入图片描述

定量精度

总体分类精度(Overall Accuracy)
分类正确的样本数/总样本数
OA=（e+f+g）/(a+b+c+d+e+f+g+h+i)
Kappa系数
P₀=OA
P_e=∑(真实样本数×分类样本数)/样本总数²
例如：P_e=[(a+b+c)×(a+d+g)+(b+e+h)×(d+e+f)+(g+h+i)×(c+f+i)] /(a+b+c+d+e+f+g+h+i)²
Kappa=(P₀－P_e )/(1-P_e)
用户精度(User accuracy )
从预测的角度出发，预测正确的样本占该类别总的预测样本数
- 类别1_{user_accuracy}=a/(a+d+g)
- 类别2_{user_accuracy}=e/(b+e+h)
- 类别3_{user_accuracy}=i/(c+f+i)
生产者精度(Producer accuracy)
用样本的角度出发，被正确预测的样本数占该类别的样本总数
- 类别1_{Prod.accuracy}=a/(a+b+c)
- 类别2_{Prod.accuracy}=e/(d+e+f)
- 类别3_{Prod.accuracy}=i/(g+h+i)

ROC曲线

roc曲线主要用来评估二分类模型的精度
在这里插入图片描述
a:TP（真阳性）
c:FP（假阳性）
b:FN（假阳性）
d:TN（真阴性）

真检率(灵敏度，击中率)
TPR=a/(a+b)
误检率(特异度，虚惊率)
FPR=c/(c+d)

ROC曲线的坐标横轴是FPR，坐标纵轴是TPR，ROC曲线描述的不是FPR与TPR间的函数关系
在这里插入图片描述

ROC曲线描述的不是FPR与TPR间的函数关系，FPR与TPR间没有函数关系，FPR与TPR是阈值τ的函数，τ描述的是样本中被检测为阳性的比率，当τ=0时，所有样本被识别为阴性，此时FPR(特异度、虚惊率、误检率)为0(FPR越小越好)，但TPR(灵敏度、命中率、真检率)为0(TPR越大越好)，当τ=1时所有样本被识别为阳性，此时TPR=1,FPR=1。因此需要选择一个合适的τ值使得TPR越大越好，FPR越小越好。

曲线下面积(Area Under Curve,AUC)
AUC等于roc曲线与坐标横轴围城的面积，是roc曲线的积分，AUC数值越大越好

Chaoying.

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
分类模型常用评价指标——混淆矩阵和roc曲线

混淆矩阵定量精度总体分类精度(Overall Accuracy)分类正确的样本数/总样本数OA=（e+f+g）/(a+b+c+d+e+f+g+h+i)Kappa系数P0=OAPe=∑(真实样本数×分类样本数)/样本总数2例如：Pe=[(a+b+c)×(a+d+g)+(b+e+h)×(d+e+f)+(g+h+i)×(c+f+i)] /(a+b+c+d+e+f+g+h+i)2Kappa=(P0－Pe )/(1-Pe)用户精度(User accuracy )从预测的角度出发，预测正确的样
复制链接

扫一扫