机器学习分类器性能指标总结（附类别不平衡问题研究）

最新推荐文章于 2020-07-25 12:06:38 发布

瑶子ove

最新推荐文章于 2020-07-25 12:06:38 发布

阅读量2.2k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_40924580/article/details/84894497

版权

本文详细介绍了ROC曲线、AUC的概念及其在分类器性能评估中的作用，强调了ROC曲线在类别不平衡问题中的局限性，并探讨了KS曲线作为补充。同时，文章还讨论了类别不平衡问题的采样方法，如过采样和欠采样，以及它们对模型性能的影响。

摘要由CSDN通过智能技术生成

一、ROC曲线

（1）定义
ROC：接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。常用于二分类问题中的模型比较，主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。
横轴：负正类率(false postive rate FPR)特异度，划分实例中所有负例占所有负例的比例；(1-Specificity)，FPR越大，预测正类中实际负类越多
纵轴：真正类率(true postive rate TPR)灵敏度，Sensitivity(正类覆盖率)，TPR越大，预测正类中实际正类越多。
（2）分析
针对一个二分类问题，将实例分成正类(postive)或者负类(negative)。但是实际中分类时，会出现四种情况.

1、若一个实例是正类并且被预测为正类，即为真正类(True Postive TP)
2、若一个实例是正类，但是被预测成为负类，即为假负类(False Negative FN)
3、若一个实例是负类，但是被预测成为正类，即为假正类(False Postive FP)
4、若一个实例是负类，但是被预测成为负类，即为真负类(True Negative TN)
在这里插入图片描述

由上表可计算得到：
1、真正类率(True Postive Rate)TPR: TP/(TP&#

最低0.47元/天解锁文章

瑶子ove

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习分类器性能指标总结（附类别不平衡问题研究）

一、ROC曲线（1）定义ROC：接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。常用于二分类问题中的模型比较，主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。横轴：负正类率(false postive rate FPR)特异度，划分实例中所有负例占所有负例的比例；(1-Specifici...
复制链接

扫一扫

专栏目录