4.4.2分类模型评判指标（四） - ROC，AUC，GINI，KS，Lift，Gain，MSE总结

最新推荐文章于 2023-09-05 02:07:50 发布

原创

最新推荐文章于 2023-09-05 02:07:50 发布 · 1.1w 阅读

108 ·

CC 4.0 BY-SA版权

简介

分类模型的评判指标光是图就有好多，ROC，AUC，GINI，KS，Lift，Gain，MSE，这些有些是图有些是指标，放在一起乱七八糟搞得人分不清东南西北。所以这里我先整体给大家一个直观的介绍。省的以后再遇上这么多图的时候完全分不清是谁是谁。

三句话概括版本：

Confusion Matrix -> Lift，Gain，ROC。

ROC -> AUC，KS -> GINI。

MSE独立出来。

中文，英文，简称

在介绍之前，我们先重新明确一下这些图表的名称，中文、英文、简称，全部来熟悉一下：

记住这个之后，我们来理解一下他们之间的关系。

拟人化概括

其实，这些图之间的关系不是很复杂。我尝试着用一个小故事概括一下8位登场人物之间的关系。

故事是这样的：

首先，混淆矩阵是个元老，年龄最大也资历最老。创建了两个帮派，一个夫妻帮，一个阶级帮。

之后，夫妻帮里面是夫妻两个，一个Lift曲线，一个Gain曲线，两个人不分高低，共用一个横轴。

再次，阶级帮里面就比较混乱。

1. 帮主是ROC曲线。

2. 副帮主是KS曲线，AUC面积

&nb

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

进击的橘子猫

关注关注

13
点赞
踩
108

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

精选资源

espressif-ide-setup-espressif-ide-2.6.0-with-esp-idf-4.4.2

01-31

esp-idf-4.4.2，非常经典的一个开发平台，需要的请下载

提升lift函数

03-03

根据评分卡的评分结果分组计算lift,可以调用后绘制lift曲线

1 条评论您还未登录，请先登录后发表或查看评论

4.4.2分类模型评判指标（二） - ROC曲线与AUC面积

Orange_Spotty_Cat的博客

05-30

9129

简介ROC曲线与AUC面积均是用来衡量分类型模型准确度的工具。通俗点说，ROC与AUC是用来回答这样的问题的：分类模型的预测到底准不准确？我们建出模型的错误率有多大？正确率有多高？两个不同的分类模型中，哪个更好用？哪个更准确？对于那些嫌太长不想看的同学，就看这两句话就好：如果我们选择用ROC曲线评判模型的准确性，那么越靠近左上角的ROC曲线，模型的准确度越高，模型越理想；如果我们选择用AUC面积评...

模型评估指标（Confusion Matrix、ROC、AUC）

平凡简单的执着

03-13

6025

文章目录1、选择合适的模型评估指标的依据2、混淆矩阵（Confusion Matrix）2.1 模型整体效果：准确率2.2 捕捉少数类：精确率（Precision）、召回率（Recall）和F1-score2.2.1 精准率(Precision)2.2.2 召回率(Recall)2.2.3 P-R曲线（Precision Recall Curve）2.2.4 F1-Score2.2.5 sklea...

机器学习分类问题：9个常用的评估指标总结

算法channel

09-02

852

你好，我是zhenguo对机器学习的评估度量是机器学习核心部分，本文总结分类问题常用的metrics分类问题评估指标在这里，将讨论可用于评估分类问题预测的各种性能指标1 Confusion Matrix这是衡量分类问题性能的最简单方法，其中输出可以是两种或更多类型的类。混淆矩阵只不过是一个具有两个维度的表，即“实际”和“预测”，此外，这两个维度都有“真阳性（TP）”、“真阴性（TN）”、“假阳性（...

分类模型评估---从混淆矩阵到ROC，AUC，GINI，KS，Lift，Gain，MSE

xys430381_1的专栏

03-06

1442

4.4.2分类模型评判指标（一） - 混淆矩阵(Confusion Matrix) https://blog.csdn.net/Orange_Spotty_Cat/article/details/80520839 4.4.2分类模型评判指标（二） - ROC曲线与AUC面积 https://blog.csdn.net/Orange_Spotty_Cat/article/details/804990...

精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么？

LegenDavid's warehouse

01-15

5003

作者：京东白条链接：https://www.zhihu.com/question/30643044/answer/222274170 来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。精确率、召回率、F1、AUC和ROC曲线其实都是评价模型好坏的指标，而且相互之间是有关系的，只是侧重点不同，题主如果理解了各指标的定义就能找出他们的区别与联系，下面就

分类模型常用评价指标1

gulie8的博客

07-04

1876

在分类模型中，常用的评价指标包括混淆矩阵、ROC曲线、AUC、KS指标、提升度等。其中针对正负样本极度不平衡的分类问题，例如广告分类预测问题，最常用的模型评价指标就是AUC。混淆矩阵是分类问题中常用的模型评价方法之一。以广告二分类问题为例，假设模型预测为正例则记为1（Positive），如点击用户；预测为反例则记为0（Negative），如非点击用户，那么我们可以将实际的数据情况与模型预测结果相结合，得到以下2×2矩阵，也就是我们常说的混淆矩阵，如图4-2所示。其中，各参数说明如下： ·T

4.4.2分类模型评判指标（一） - 混淆矩阵(Confusion Matrix)

热门推荐

Orange_Spotty_Cat的博客

05-31

19万+

简介混淆矩阵是ROC曲线绘制的基础，同时它也是衡量分类型模型准确度中最基本，最直观，计算最简单的方法。一句话解释版本：混淆矩阵就是分别统计分类模型归错类，归对类的观测值个数，然后把结果放在一个表里展示出来。这个表就是混淆矩阵。数据分析与挖掘体系位置混淆矩阵是评判模型结果的指标，属于模型评估的一部分。此外，混淆矩阵多用于判断分类器（Classifier）的优劣，适用于...

二分类混淆矩阵结构_「混淆矩阵」4.4.2分类模型评判指标（一） - 混淆矩阵(Confusion Matrix) - seo实验室...

weixin_39762666的博客

01-30

3869

混淆矩阵简介混淆矩阵是ROC曲线绘制的基础，同时它也是衡量分类型模型准确度中最基本，最直观，计算最简单的方法。一句话解释版本：混淆矩阵就是分别统计分类模型归错类，归对类的观测值个数，然后把结果放在一个表里展示出来。这个表就是混淆矩阵。数据分析与挖掘体系位置混淆矩阵是评判模型结果的指标，属于模型评估的一部分。此外，混淆矩阵多用于判断分类器(Classifier)的优劣，适用于分类型的数据模型，如分类...

机器学习——常用的分类模型性能评价指标

LL20246033的博客

02-22

9023

分类模型的性能评价指标，主要包含准确率，精确率、召回率、f1_score，ROC曲线，AUC等 1、分类评价指标先列出混淆矩阵其中： TP：真实值是positive，模型分为positive FN：真实值是positive，模型分为negative FP：真实值是negative，模型分为positive TN：真实值是negative，模型认为是negative 1.1、准确度（Accuracy）准确度：对于给定的测试集，模型正确分类的样本数与总样本数之比。公式为： 1.2、精确度（preci

基于随机森林模型的预测概率和标签信息可视化ROC曲线

BitSlinger的博客

09-05

1050

在本文中，我们将介绍如何使用Python和scikit-learn库构建随机森林模型，并可视化其预测概率和标签信息的ROC曲线。我们将使用scikit-learn的随机森林分类器（RandomForestClassifier）来构建模型，并使用ROC曲线评估模型性能。曲线越接近左上角，模型的性能越好。ROC曲线可以帮助我们评估模型的性能，并可视化模型的分类结果。然后，我们将数据集拆分为训练集和测试集，其中80%的数据用于训练，20%的数据用于测试。然后，我们使用模型对测试数据进行预测，并获取预测的概率值。

评价分类模型的性能指标

修炼之路

03-28

1万+

当一个模型构建完成之后，我们可以通过几个不同的性能指标来衡量分类模型的相关性能，常用的分类性能指标有准确率(precision)、召回率(recall)和F1分数(F1-score)。一、混淆矩阵混淆矩阵(confusion matrix):是展示分类学习算法的一种性能矩阵(方阵)，包括分类器预测结果真正(true positive)、真负(true negative)、假正(false ...

机器学习---回归模型和分类模型的评价指标体系

王不留行嘿呦嘿

02-25

4395

ROC曲线有个很好的特性：当测试集中的正负样本的分布变换的时候，ROC曲线能够保持不变。在实际的数据集中经常会出现样本类不平衡，即正负样本比例差距较大，而且测试数据中的正负样本也可能随着时间变化所有的 M×N(M为正类样本的数目，N为负类样本的数目)个正负样本对中, 它也是首先对score从大到小排序，然后令最大score对应的sample 的rank为n，第二大score对应sampl...

python绘制roc曲线，lift曲线

L.Z.的博客

02-09

1万+

roc曲线和lift曲线是模型评价的指标，我们在建好模型后经常会用这两个指标对模型进行评估。在建模过程中发现python竟然没有自动生成roc曲线和lift曲线的包。我自己写了两个函数，能够做出roc曲线和lift曲线。希望可以给大家工作和学习带来一些方便。函数如下，大家可以直接调用。 from scipy.stats import scoreatpercentile import sea...

#####好好好####关于模型检验的ROC值和KS值的异同_ROC曲线和KS值

木东的博客

11-16

2645

关于模型检验的ROC值和KS值的异同_ROC曲线和KS值按我的理解，ROC曲线是累计坏占比曲线（图中蓝色曲线）下面的面积（>0.5），KS值是累计坏占比曲线-累计好占比曲线差值（图中红色曲线）的最大值。实际上他们都是一样的？不知道我的理解是否有误？谢谢！精彩解答： ROC(Receiver Operating Characteristic Cu

lift曲线

wj1298250240的博客

01-08

1876

二、lift曲线在营销推广活动（例如DM信）中，我们的首要目标并不是尽可能多地找出那些潜在客户，而是提高客户的响应率。客户响应率是影响投入产出比的重要因素。此时，我们关注的不再是TPR（覆盖率），而是另一个指标：命中率。计算距离：例如，若经验告诉我们10000个消费者中有1000个是我们的潜在客户，则我们向这10000个消费者发放传单的效率是10%（即客户的响应率是10%），k=(c+d)/...

回归和分类模型性能评估指标MSE,MAE,PR,ROC,AUC

CSDN_SUSAN的博客

01-07

8510

文章目录0. 模型评估是什么，为什么1. 不同类型问题的评估指标 0. 模型评估是什么，为什么模型评估其本质是为了解决模型的泛化问题，由于各种原因，训练完成的模型可能会产生过拟合和欠拟合问题，因此需要对模型评估其泛化能力，并进行合适的参数调整以求得模型最优。为什么要进行模型评估？除了考虑到模型泛化能力的问题，同时也要兼顾不同业务场景下的业务指标不同。对于不同的业务场景，选择对应的评估指标，可...

【模型指标】ks,gini值，auc的关系

changzoe的博客

11-06

1663

做风控也很久了，一直没有整理ks,gini,auc的关系，下边简单谈一下自己的理解，立下flag,以后每两天更新一篇，谈谈自己对指数的理解。先说一下ks ks值和ks曲线：将所有样本根据分数值从低到高排序（即坏账率从高到低）均分成10组，分别计算这10组的实际好样本数、坏样本数、累积好样本数、累积坏样本数、累积好样本数占比、累积坏样本数占比，差值。其中实际好坏样本数分别为该组内的好坏样本数，累...