利用scikitlearn画ROC曲线

最新推荐文章于 2025-06-20 22:11:15 发布

mishidemudong

最新推荐文章于 2025-06-20 22:11:15 发布

阅读量1.9w

点赞数 2

CC 4.0 BY-SA版权

分类专栏： Python语法相关数据挖掘

本文链接：https://blog.csdn.net/u010159842/article/details/53082003

一个完整的数据挖掘模型，最后都要进行模型评估，对于二分类来说，AUC，ROC这两个指标用到最多，所以利用sklearn里面相应的函数进行模块搭建。

具体实现的代码可以参照下面博友的代码，评估svm的分类指标。注意里面的一些细节需要注意，一个是调用roc_curve 方法时，指明目标标签，否则会报错。具体是这个参数的设置pos_label ，以前在unionbigdata实习时学到的。

重点是以下的代码需要根据实际改写：

    mean_tpr = 0.0  
    mean_fpr = np.linspace(0, 1, 100)  
    all_tpr = []
    
    y_target = np.r_[train_y,test_y]
    cv = StratifiedKFold(y_target, n_folds=6)

        #画ROC曲线和计算AUC
        fpr, tpr, thresholds = roc_curve(test_y, predict,pos_label = 2)##指定正例标签，pos_label = ###########在数之联的时候学到的，要制定正例
        
        mean_tpr += interp(mean_fpr, fpr, tpr)          #对mean_tpr在mean_fpr处进行插值，通过scipy包调用interp()函数  
        mean_tpr[0] = 0.0                               #初始处为0  
        roc_auc = auc(fpr, tpr)  
        #画图，只需要plt.plot(fpr,tpr),变量roc_auc只是记录auc的值，通过auc()函数能计算出来  
        plt.plot(fpr, tpr, lw=1, label='ROC  %s (area = %0.3f)' % (classifier, roc_auc))

然后是博友的参考代码：

[python]view plaincopy 
   
 # -*- coding: utf-8 -*-  
 """ 
 Created on Sun Apr 19 08:57:13 2015 
  
 @author: shifeng 
 """  
 print(__doc__)  
   
 import numpy as np  
 from scipy import interp  
 import