python两种方法求ROC曲线下面积(AUC)

最新推荐文章于 2024-09-20 08:39:31 发布

Wang_Mole

最新推荐文章于 2024-09-20 08:39:31 发布

阅读量1.6k

点赞数

文章标签： python 深度学习机器学习

本文链接：https://blog.csdn.net/Wang_Mole/article/details/125954988

版权

该博客介绍了如何利用Python的RandomForestClassifier进行模型训练，并通过predict_proba()方法获取预测概率。接着，博主分别展示了两种计算ROC曲线下面积的方法：一是使用roc_auc_score函数，二是直接计算fpr和tpr并利用auc函数。内容涵盖了ROC曲线的重要性和在评估二分类模型性能中的应用。

摘要由CSDN通过智能技术生成

前置代码：（分数据就不多赘述了）

# 定义RF
rf = RandomForestClassifier(n_estimators=40, max_depth=5, random_state=0)
# 训练模型
rf_SDVData2.fit(X_train, Y_train)
# predict_proba()返回预测属于某标签的概率
pred = rf.predict_proba(X_test)[:, 1]

方法一

# roc_auc_score函数返回曲线下面积
roc_auc = roc_auc_score(Y_test, pred)

方法二

fpr_Nb, tpr_Nb, _ = roc_curve(df_data_sdv_Y_test, pred)
roc_auc = auc(fpr_Nb, tpr_Nb)

（roc_auc为曲线下面积）

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Wang_Mole

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python:实现area under curve曲线下面积算法(附完整源码)

希望我的博客，能帮上你解决学习中工作中所遇到的问题

07-29

627

Python:实现area under curve曲线下面积算法(附完整源码)

python 计算曲线面积_机器学习中的AUC-ROC曲线

weixin_39672443的博客

11-20

699

AUC-ROC曲线你已经建立了你的机器学习模型-那么接下来呢？你需要对它进行评估，并验证它有多好(或有多坏)，这样你就可以决定是否实现它。这时就可以引入AUC-ROC曲线了。这个名字可能有点夸张，但它只是说我们正在计算“Receiver Characteristic Operator”(ROC)的“Area Under the Curve”(AUC)。别担心，我们会详细了解这些术语的含义，一切都将...

参与评论您还未登录，请先登录后发表或查看评论

python计算函数曲线与x轴包围的面积_Python求正态分布曲线下面积实例

weixin_39775910的博客

11-23

1035

正态分布应用最广泛的连续概率分布，其特征是“钟”形曲线。这种分布的概率密度函数为：其中，μ为均值，σ为标准差。求正态分布曲线下面积有3σ原则:正态曲线下，横轴区间（μ-σ，μ+σ）内的面积为68.268949%，横轴区间（μ-1.96σ，μ+1.96σ）内的面积为95.449974%，横轴区间（μ-2.58σ，μ+2.58σ）内的面积为99.730020%。求任意区间内曲线下的面积，通常可以引用s...

Python求正态分布曲线下面积实例

09-18

今天小编就为大家分享一篇Python求正态分布曲线下面积实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

【机器学习】AUC （ROC曲线下方的面积大小）及python代码示例

小苏打的学习博客

07-12

6073

AUC（Area Under Curve）被定义为ROC曲线下与坐标轴围成的面积，显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方，所以AUC的取值范围在0.5和1之间。 ROC曲线的横坐标是伪阳性率（也叫假正类率，False Positive Rate），纵坐标是真阳性率（真正类率，True Positive Rate），相应的还有真阴性率（真负类率，True N...

python画出roc曲线 auc计算逻辑_ROC及AUC计算方法及原理

weixin_32392989的博客

02-21

1783

1.非均衡分类问题在大多数情况下不同类别的分类代价并不相等，即将样本分类为正例或反例的代价是不能相提并论的。例如在垃圾邮件过滤中，我们希望重要的邮件永远不要被误判为垃圾邮件，还有在癌症检测中，宁愿误判也不漏判。在这种情况下，仅仅使用分类错误率来度量是不充分的，这样的度量错误掩盖了样例如何被错分的事实。所以，在分类中，当某个类别的重要性高于其他类别时，可以使用Precison和Recall多个比分类...

python roc计算_Python画ROC曲线和AUC值计算（附代码）

weixin_33936194的博客

01-12

3097

前言ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣。这篇文章将先简单的介绍ROC和AUC，而后用实例演示如何python作出ROC曲线图以及计算AUC。AUC介绍AUC(Area Under Curve)是机器学习二分类模型中非常常用的评估指标，相比于F1-Score对项目的不平衡有更大...

python多分类画roc曲线_多分类下的ROC曲线和AUC

weixin_39616477的博客

12-22

2301

本文主要介绍一下多分类下的ROC曲线绘制和AUC计算，并以鸢尾花数据为例，简单用python进行一下说明。如果对ROC和AUC二分类下的概念不是很了解，可以先参考下这篇文章：http://blog.csdn.net/ye1215172385/article/details/79448575由于ROC曲线是针对二分类的情况，对于多分类问题，ROC曲线的获取主要有两种方法：假设测试样本个数为m，类别个...

ROC曲线，AUC面积

dili8870的博客

03-24

3341

　　AUC(Area under Curve)：Roc曲线下的面积，介于0.1和1之间。Auc作为数值可以直观的评价分类器的好坏，值越大越好。　　首先AUC值是一个概率值，当你随机挑选一个正样本以及负样本，当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率就是AUC值，AUC值越大，当前分类算法越有可能将正样本排在负样本前面，从而能够更好地分类。 1. 什么是...

利用Python画ROC曲线和AUC值计算

12-23

前言 ROC（Receiver Operating Characteristic）曲线和AUC常被用来评价一个二值分类器（binary classifier）的优劣。这篇文章将先简单的介绍ROC和AUC，而后用实例演示如何python作出ROC曲线图以及计算AUC。 AUC介绍 AUC(Area Under Curve)是机器学习二分类模型中非常常用的评估指标，相比于F1-Score对项目的不平衡有更大的容忍性，目前常见的机器学习库中(比如scikit-learn)一般也都是集成该指标的计算，但是有时候模型是单独的或者自己编写的，此时想要评估训练模型的好坏就得自己搞一个AUC计算模块，本文在

python:Sklearn SVM使用留一法时如何绘制ROC曲线与计算AUC

qq_38941890的博客

06-07

4357

在前面的一篇文章我们给出了使用Sklearn 中的SVM进行分类时如何使用留一法来进行分类。 python基于sklearn的SVM和留一法（LOOCV）进行二分类如何在使用留一法时绘制ROC曲线和AUC 什么是ROC曲线和？这个可以参考如下的文章。部分内容摘抄于此 ROC曲线与AUC面积定义原文链接 ROC曲线，全称The Receiver Operating Characteristic Curve，译为受试者操作特性曲线。这是一条以不同阈值下的假正率FPR为横坐标，不同阈值下的召回率Recall

Python求正态分布曲线下面积

最新发布

luthane的博客

09-20

536

Area Under Curve”（AUC）曲线下面积算法通常用于衡量二元分类模型的性能，特别是在机器学习和统计中。AUC主要基于ROC（Receiver Operating Characteristic）曲线，该曲线以假正率（FPR）为横坐标，真正率（TPR）为纵坐标。AUC是ROC曲线下的面积，表示随机正类别样本位于随机负类别样本右侧的概率。梯形法：这是最常见的计算方法。通过将ROC曲线分割成多个小梯形，计算每个梯形的面积，然后将它们相加得到总面积。

1.python基础语法

weixin_33924770的博客

01-16

标识符（变量、函数名）第一个字符必须是字母表中字母或下划线_。标识符的其他的部分由字母、数字和下划线组成。标识符对大小写敏感。注释 Python中单行注释以#开头，多行注释可以用多个#号，还有'''和""" 行与缩进 python中用空格来识别父级和子级的关系多行语句 Python 通常是一行写完一条语句，但如果语句很长，可以使用反斜杠(\)来...

python计算ROC曲线和面积AUC

Mr.horse的博客

08-04

4469

ROC曲线是根据一系列不同的二分类方式（分界值或决定阈），以真正率（也就是灵敏度）（True Positive Rate,TPR）为纵坐标，假正率（1-特效性）（False Positive Rate,FPR）为横坐标绘制的曲线。通过将连续变量设定出多个不同的临界值，从而计算出一系列敏感性和特异性，从而可以绘制ROC曲线。纵坐标：真正率（True Positive Rate , TPR）或灵敏度（sensitivity） TPR = TP /（TP + FN）（正样本预测结果数 / 正样本实际数）

python绘制多分类的ROC曲线

05-04

绘制多分类的ROC曲线可以使用micro-averaging和macro-averaging两种方法。 1. micro-averaging方法： micro-averaging方法将所有的TP、FP、FN的数量累加，再计算ROC曲线。对于多分类问题，我们可以将每个类别的TP、FP、FN数量累加起来，得到总的TP、FP、FN数量，然后计算ROC曲线。以下是使用micro-averaging方法绘制多分类的ROC曲线的示例代码： ```python from sklearn.metrics import roc_curve, auc import matplotlib.pyplot as plt import numpy as np # y_true是真实标签，y_pred是预测标签概率 y_true = np.array([0, 1, 2, 0, 1, 2]) y_pred = np.array([[0.9, 0.05, 0.05], [0.05, 0.9, 0.05], [0.05, 0.05, 0.9], [0.8, 0.1, 0.1], [0.1, 0.8, 0.1], [0.1, 0.1, 0.8]]) # 计算ROC曲线和AUC fpr = dict() tpr = dict() roc_auc = dict() n_classes = 3 for i in range(n_classes): fpr[i], tpr[i], _ = roc_curve(y_true == i, y_pred[:, i]) roc_auc[i] = auc(fpr[i], tpr[i]) # micro-averaging方法 fpr["micro"], tpr["micro"], _ = roc_curve(y_true.ravel(), y_pred.ravel()) roc_auc["micro"] = auc(fpr["micro"], tpr["micro"]) # Plot ROC curves plt.figure() plt.plot(fpr["micro"], tpr["micro"], label='micro-average ROC curve (area = {0:0.2f})' ''.format(roc_auc["micro"]), linewidth=2) colors = ['aqua', 'darkorange', 'cornflowerblue'] for i, color in zip(range(n_classes), colors): plt.plot(fpr[i], tpr[i], color=color, lw=2, label='ROC curve of class {0} (area = {1:0.2f})' ''.format(i, roc_auc[i])) plt.plot([0, 1], [0, 1], 'k--', lw=2) plt.xlim([0.0, 1.0]) plt.ylim([0.0, 1.05]) plt.xlabel('False Positive Rate') plt.ylabel('True Positive Rate') plt.title('Receiver operating characteristic for multi-class') plt.legend(loc="lower right") plt.show() ``` 2. macro-averaging方法： macro-averaging方法将每个类别的ROC曲线计算出来，然后对所有的ROC曲线取平均。对于多分类问题，我们可以将每个类别的TP、FP、FN数量分别计算出ROC曲线，然后对所有的ROC曲线取平均。以下是使用macro-averaging方法绘制多分类的ROC曲线的示例代码： ```python from sklearn.metrics import roc_curve, auc import matplotlib.pyplot as plt import numpy as np # y_true是真实标签，y_pred是预测标签概率 y_true = np.array([0, 1, 2, 0, 1, 2]) y_pred = np.array([[0.9, 0.05, 0.05], [0.05, 0.9, 0.05], [0.05, 0.05, 0.9], [0.8, 0.1, 0.1], [0.1, 0.8, 0.1], [0.1, 0.1, 0.8]]) # 计算ROC曲线和AUC fpr = dict() tpr = dict() roc_auc = dict() n_classes = 3 for i in range(n_classes): fpr[i], tpr[i], _ = roc_curve(y_true == i, y_pred[:, i]) roc_auc[i] = auc(fpr[i], tpr[i]) # macro-averaging方法 all_fpr = np.unique(np.concatenate([fpr[i] for i in range(n_classes)])) mean_tpr = np.zeros_like(all_fpr) for i in range(n_classes): mean_tpr += np.interp(all_fpr, fpr[i], tpr[i]) mean_tpr /= n_classes fpr["macro"] = all_fpr tpr["macro"] = mean_tpr roc_auc["macro"] = auc(fpr["macro"], tpr["macro"]) # Plot ROC curves plt.figure() plt.plot(fpr["macro"], tpr["macro"], label='macro-average ROC curve (area = {0:0.2f})' ''.format(roc_auc["macro"]), linewidth=2) colors = ['aqua', 'darkorange', 'cornflowerblue'] for i, color in zip(range(n_classes), colors): plt.plot(fpr[i], tpr[i], color=color, lw=2, label='ROC curve of class {0} (area = {1:0.2f})' ''.format(i, roc_auc[i])) plt.plot([0, 1], [0, 1], 'k--', lw=2) plt.xlim([0.0, 1.0]) plt.ylim([0.0, 1.05]) plt.xlabel('False Positive Rate') plt.ylabel('True Positive Rate') plt.title('Receiver operating characteristic for multi-class') plt.legend(loc="lower right") plt.show() ```