12天summer----数据挖掘实战-模型评估

最新推荐文章于 2021-12-25 16:44:48 发布

beautiful_well

最新推荐文章于 2021-12-25 16:44:48 发布

阅读量179

点赞数

分类专栏： DataWhale-数据挖掘实战文章标签：模型评估

本文链接：https://blog.csdn.net/beautiful_well/article/details/99709788

版权

DataWhale-数据挖掘实战专栏收录该内容

9 篇文章 1 订阅

订阅专栏

记录5个模型（逻辑回归、SVM、决策树、随机森林、XGBoost）关于accuracy、precision，recall和F1-score、auc值的评分表格，并画出ROC曲线。参考：https://www.jianshu.com/p/5df19746daf9 https://blog.csdn.net/huacha__/article/details/81029680

先定义评估函数

#记录5个模型（逻辑回归、SVM、决策树、随机森林、XGBoost）关于accuracy、precision，recall和F1-score、auc值的评分表格，
#并画出ROC曲线。
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import recall_score
from sklearn.metrics import f1_score
from sklearn.metrics import roc_auc_score
def eva(y_real,y_predict):
    acc = accuracy_score(y_real, y_predict)
    precision = precision_score(y_real, y_predict)
    recall = recall_score(y_real, y_predict)
    f1=f1_score(y_real, y_predict,average='weighted')
    auc = roc_auc_score(y_real,y_predict)
    return acc,precision,recall,f1,auc

训练集与测试集的评估指标

import warnings
warnings.filterwarnings('ignore')  # "error", "ignore", "always", "default", "module" or "once"
names = ["LR","SVC", "DT", "RFC","Xgb"]
evals=["acc","precision","recall","f1","auc"]
scores=[]
for pred in y_train_pred:
    score = eva(y_train, pred)
    scores.append(score)
df_train=pd.DataFrame(scores,columns=evals,index=names)

画训练集和测试集ROC曲线

from sklearn.metrics import roc_auc_score, auc,roc_curve
import matplotlib.pyplot as plt
#训练集
# for pred in y_train_pred:
#   fpr, tpr, thresholds =roc_curve(y_train,pred)
#测试集
for pred in y_pred:
  fpr, tpr, thresholds =roc_curve(y_test,pred)
roc_auc = auc(fpr, tpr)  #auc为Roc曲线下的面积
#开始画ROC曲线
plt.plot(fpr, tpr, 'b',label='AUC = %0.2f'% roc_auc)
plt.legend(loc='lower right')
plt.plot([0,1],[0,1],'r--')
plt.xlim([-0.1,1.1])
plt.ylim([-0.1,1.1])
plt.xlabel('False Positive Rate') #横坐标是fpr
plt.ylabel('True Positive Rate')  #纵坐标是tpr
plt.title('Receiver operating characteristic example')
plt.show()

beautiful_well

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
12天summer----数据挖掘实战-模型评估

记录5个模型（逻辑回归、SVM、决策树、随机森林、XGBoost）关于accuracy、precision，recall和F1-score、auc值的评分表格，并画出ROC曲线。参考：https://www.jianshu.com/p/5df19746daf9https://blog.csdn.net/huacha__/article/details/81029680先定义评估函数#...
复制链接

扫一扫

专栏目录