机器学习中的三个评价指标

机器学习中的评价模型性能的指标

  1. 混淆矩阵
    1)根据下面的混淆矩阵,我们可以得到下面几个指标,他们是一级指标:
    真实值是positive,模型认为是positive的数量(True Positive=TP) 真实值是positive,模型认为是negative的数量(False Negative=FN):这就是统计学上的第二类错误(Type II Error)
    真实值是negative,模型认为是positive的数量(False Positive=FP):这就是统计学上的第一类错误(Type I Error)
    真实值是negative,模型认为是negative的数量(True Negative=TN)
    在这里插入图片描述
    2)混淆矩阵统计的是个数,对于大量的数据,个数很难衡量模型的优势,因此又延伸了四个二级指标:
    A.准确率(Accuracy)—— 针对整个模型
    B.精确率(Precision)
    C.灵敏度(Sensitivity):就是召回率(Recall)
    D.特异度(Specificity)
    在这里插入图片描述
    3)三级指标
    这个指标叫做F1 Score。
    他的计算公式是:
    在这里插入图片描述
    其中,P代表Precision,R代表Recall。
    F1-Score指标综合了Precision与Recall的产出的结果。
    F1-Score的取值范围从0到1的,1代表模型的输出最好,0代表模型的输出结果最差。
  2. ROC曲线
    横坐标为假阳性率(False positive rate,FPR),纵坐标为真阳性率(True positive rate,TPR)。
    假阳性率 FPR = FP/N —N个负样本中被判断为正样本的个数占真实的负样本的个数
    真阳性率 TPR = TP/P —P个正样本中被预测为正样本的个数占真实的正样本的个数
    ROC曲线一定程度上可以反映分类器的分类效果,但是不够直观,为了更直观的显示其分类性能,就有了AUC面积。AUC实际上就是ROC曲线下的面积。AUC直观地反映了ROC曲线表达的分类能力
  3. AUC面积
    1)只能用于二分类;
    2)AUC面积是ROC曲线下方与坐标轴围成的面积;
    3)AUC的取值范围:
    AUC=1,完美分类器,采用这个预测模型时,不管设定什么阈值都能得出完美预测。绝大多数预测的场合,不存在完美分类器;
    0.5<AUC<1,优于随机猜测,这个分类器(模型)妥善设定阈值的话,能有预测价值;
    AUC=0.5,跟随机猜测一样(例:丢铜板),模型没有预测价值;
    AUC<0.5,说明模型很差或者代码有问题。
    4)由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值一般在0.5~1之间;
    5)AUC越大,说明分类器越可能把真正的正样本排在前面,分类性能越好;
    6)ROC能够尽量降低不同测试集带来的干扰,更加客观的衡量模型本身的性能。
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值