机器学习分类模型评估指标

目录

0 混淆矩阵

1 基本指标

1.1 准确率(Accuracy)

1.2 精确率(Precision)

1.3 召回率(Recall) 

2 F1值 

3 G分数 

4  ROC曲线和AUC值

5 写在最后


0 混淆矩阵

预测情况真实情况
10
1TPFP
0FNTN
  • P(Positive):代表1,表示预测为正样本
  • N(Negative):代表0,表示预测为负样本
  • T(True):代表预测正确
  • F(False):代表预测错误

1 基本指标

1.1 准确率(Accuracy)

Accuracy=(TP+TN)/(TP+TN+FP+FN)

1.2 精确率(Precision)

Precision=TP/(TP+FP)

1.3 召回率(Recall) 

 Recall=TP/(TP+FN)

例如医学诊断中,预测患病并且真的患病的病人占全部患病病人的比例。


2 F1值 

recall和precision的调和平均数

1. recall的重要性是precision的β倍

2. F1是β=1时候的特殊情况

3. F1值越高越好。它表示模型在精确率和召回率之间取得了较好的平衡


3 G分数 

G分数被定义为召回率和精确率的几何平均数

                                                         G=\sqrt{recall*precision} 

G分数越高越好。它表示模型在精确率和召回率之间取得了较好的平衡,适用于在处理正负样本不平衡时评估分类器性能。 


4  ROC曲线和AUC值

预测情况真实情况
10
1TPFP
0FNTN

ROC曲线纵坐标为TPR,横坐标为FPR,在不断改变阈值时形成的曲线

1.TPR(召回率)

2. FPR(假阳性)

说明:

1)对于同一个测试集来说,P(真实为1)和N(真实为0)的值是不变的

2)TP为分对的情况,FP为本来应该为0的结果预测成了1,所以TRP越大并且FRP越小时,越好

AUC:ROC曲线围成的面积(0-1之间)越大越好

AUC值越大,当前的分类算法越有可能正样本分值高于负样本分值,既分类效果更好

5 写在最后

参考:视频 、 CSDN

  • 13
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值