机器学习分类器性能指标总结(附类别不平衡问题研究)

本文详细介绍了ROC曲线、AUC的概念及其在分类器性能评估中的作用,强调了ROC曲线在类别不平衡问题中的局限性,并探讨了KS曲线作为补充。同时,文章还讨论了类别不平衡问题的采样方法,如过采样和欠采样,以及它们对模型性能的影响。
摘要由CSDN通过智能技术生成

一、ROC曲线

(1)定义
ROC: 接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。常用于二分类问题中的模型比较,主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。
横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specificity),FPR越大,预测正类中实际负类越多
纵轴:真正类率(true postive rate TPR)灵敏度,Sensitivity(正类覆盖率),TPR越大,预测正类中实际正类越多。

(2)分析
针对一个二分类问题,将实例分成正类(postive)或者负类(negative)。但是实际中分类时,会出现四种情况.

1、若一个实例是正类并且被预测为正类,即为真正类(True Postive TP)
2、若一个实例是正类,但是被预测成为负类,即为假负类(False Negative FN)
3、若一个实例是负类,但是被预测成为正类,即为假正类(False Postive FP)
4、若一个实例是负类,但是被预测成为负类,即为真负类(True Negative TN)
在这里插入图片描述

由上表可计算得到:
1、真正类率(True Postive Rate)TPR: TP/(TP&#

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值