【机器学习要点记录】metrics.roc_auc_score:使用 model.predict() 和 model.predict_proba() 效果差别很大

以前使用roc_auc_score都是用model.predict()的预测结果,错了那么久。。。。。。

查看官网注释才知道应该用model.predict_proba()的预测结果。

做了个对比试验,分别使用model.predict() 和 model.predict_proba()的预测结果,观察AUC值发现,相比于使用model.predict_proba()的AUC值,使用model.predict()的AUC值偏小。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
from sklearn import metrics from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from imblearn.combine import SMOTETomek from sklearn.metrics import auc, roc_curve, roc_auc_score from sklearn.feature_selection import SelectFromModel import pandas as pd import numpy as np import matplotlib matplotlib.use('TkAgg') import matplotlib.pyplot as plt from sklearn.metrics import confusion_matrix #1、数据输入 df_table_all = pd.read_csv(r"D:\trainafter.csv",index_col=0) #2、目标和特征区分 X = df_table_all.drop(["Y"],axis=1).values Y = np.array(df_table_all["Y"]) #3、按比例切割数据 X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size=0.3,random_state=0) #4、样本平衡, st= SMOTETomek() X_train_st,Y_train_st = st.fit_resample(X_train,Y_train) #4、特征选择: #创建特征选择模型 sfm = SelectFromModel(LogisticRegression(penalty='l1',C=1.0,solver="liblinear")) #训练特征选择模型 sfm.fit(X_train,Y_train) #讲数据转换,剩下重要的特征 X_train_tiny = sfm.transform(X_train) X_test_tiny = sfm.transform(X_test) #5、创建模型 model = LogisticRegression(penalty='l1',C=1.0,solver="liblinear") model.fit(X_train_st_tiny,Y_train_st) #6、预测 y_pred = model.predict_proba(X_test_st_tiny) y_cate = model.predict(X_test_st_tiny) c=confusion_matrix(Y_test,y_cate) print(c) def report_auc(y_true,y_prob,title,out_name="",lw=2): fpr,tpr,_=roc_curve(y_true,y_prob,pos_label=1) print(fpr) print(tpr) plt.figure() plt.plot(fpr,tpr,color="darkorange",lw=lw,lable="ROC curve") plt.plot([0,1],[0,1],color="yellow",lw=lw,linestyle="--") plt.xlim([0,1]) plt.ylim([0,1.05]) plt.title(title) plt.legend(loc='lower right') plt.show(0) plt.savefig(r"d:\LR"+out_name,dpi=800) plt.close("all") report_auc(Y_test,y_pred[:,1],"Logistic with L1 panetly",'LG')
最新发布
03-14

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值