metrics.roc_curve与r2_score

最新推荐文章于 2023-09-21 14:59:42 发布

卢容和

最新推荐文章于 2023-09-21 14:59:42 发布

阅读量490

点赞数

分类专栏：算法分析与设计文章标签： 1024程序员节机器学习

本文链接：https://blog.csdn.net/qq_41329791/article/details/109265483

版权

算法分析与设计专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文详细解释了ROC曲线的构成，包括FPR、TPR和阈值的概念，并通过实例展示了如何使用scikit-learn计算ROC曲线。同时，介绍了AUC作为衡量模型性能的指标，强调其表示模型将正样本排列在负样本之前的概率。文章指出，正确计算AUC应基于预测概率，而非分类结果。最后提到了R2_score在回归任务中的应用，但指出其在某些情况下并不适用。

摘要由CSDN通过智能技术生成

ROC曲线

链接1：https://blog.csdn.net/sun91019718/article/details/101314545

讲解了fpr,tpr,threshold=roc_curve(y_true,y_score)

阈值是y_score内的元素去重后加入一个‘最大值+1’的值降序排序后组成的数据,每一个元素作为阈值，数据类型是一维数组。比如:y_score=np.array([0, 1, 2,0,3,1])对应的threshold=np.array([4, 3, 2,1,0])

y_true：真实结果数据，数据类型是数组
y_score：预测结果数据，可以是标签数据也可以是概率值，数据类型是形状与y_true一致的数组
pos_label：默认为None,只有当标签数据如{0,1}、{-1，1}二分类数据才能默认；否则需要设置正样本值

我的scikit-learn (0.18.1)

import numpy as np
from sklearn import metrics
y = np.array([1, 1, 2, 2])
scores = np.array([0.1, 0.4, 0.35, 0.8])
fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label=2)
print(fpr,’\n’,tpr,’\n’,thresholds)
[0. 0.5 0.5 1. ]
[0.5 0.5 1. 1. ]
[0.8 0.4 0.35 0.1 ]
没有最大值+1，可能是旧版本

官网链接

import numpy as np
from sklearn import metrics
y = np.array([1, 1, 2, 2])
scores = np.array([0.1, 0.4, 0.35, 0.8])
fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label=2)