scikit-learn中GridSearchCV的使用:多模型,可视化

本文介绍了如何在scikit-learn中使用GridSearchCV进行多模型选择,并通过AUC和AUPR曲线进行效果评估和可视化。步骤包括模型构建、GridSearchCV应用、最佳参数模型选择、训练与测试集拟合,以及最终的可视化结果展示。
摘要由CSDN通过智能技术生成

步骤:

1.选择并构建训练模型model

2.将训练模型model投入到GridSearchCV中,得到GridSearchCV模型grid_model

3.用grid_model拟合训练集数据,选择在validation_dataset上效果最好的参数的模型best_estimator

4.1.用best_estimator拟合训练集(得到的结果应该与之前不同,因为之前用交叉验证等方法对训练集进行了分割)

4.2.用best_estimator拟合测试集

5.结果可视化:AUC曲线,AUPR曲线


一.数据

【数据准备】

  Size Size
训练集 (1206, 294) (1206,)
测试集 (64, 294) (64,)

二.主模型

【搭建环境】

from sklearn.neural_network import MLPClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.gaussian_process import GaussianProcessClassifier
from sklearn.gaussian_process.kernels import RBF
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis
from sklearn.model_selection import GridSearchCV,cross_val_score
from sklearn.metrics import accuracy_score,precision_score,recall_score,f1_score
from sklearn.metrics import auc,roc_auc_score,roc_curve,precision_recall_curve
from sklearn.metrics import confusion_matrix,make_scorer

【模型准备】

seed = 1231
np.random.seed(seed)
x_train,y_train,x_test,y_test = x_train,y_train,x_test,y_test

names = ['Decision Tree', 'Random Forest']
classifiers = [DecisionTreeClassifier(),RandomForestClassifier()]

parameter_dtc = {'max_features':['auto','sqrt','log2',None
  • 2
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值