客户逾期贷款预测[6] - 网格搜索调参和交叉验证

最新推荐文章于 2024-01-13 21:26:46 发布

truffle528

最新推荐文章于 2024-01-13 21:26:46 发布

阅读量694

点赞数 2

分类专栏：机器学习文章标签：网格搜索调参交叉验证机器学习

本文链接：https://blog.csdn.net/truffle528/article/details/84379538

版权

本文介绍了使用网格搜索对模型进行调优，并通过五折交叉验证进行模型评估的过程。在数据预处理后，观察到部分模型在调参后训练集评分下降但测试集评分提升，探讨了这一现象的可能原因，并指出在参数选择时需要更有针对性，以节省调参时间。

摘要由CSDN通过智能技术生成

任务

使用网格搜索对模型进行调优并采用五折交叉验证的方式进行模型评估

实现

之前已经进行过数据探索，缺失值和异常值处理、特征生成、特征删除、缩放等处理，具体可见前几篇博客。本文只进行带交叉验证的网格搜索调参，然后与调参前评分做比较。

from sklearn.model_selection import GridSearchCV,train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.tree import DecisionTreeClassifier
from xgboost.sklearn import XGBClassifier
from lightgbm.sklearn import LGBMClassifier

X_std_train,X_std_test,y_train,y_test = train_test_split(X_std,y,test_size=0.3,random_state=1122)

#网格搜索调参
def gridSearch_vali(model,param_grid,cv=5):
    print("parameters:{}".format(param_grid))
    grid_search = GridSearchCV(estimator=model,param_grid=param_grid,cv=cv,scoring='f1_micro')
    grid_search.fit(X_std_train,y_train)
    print("Best parameters for",model,"is:{}".format(grid_search.best_params_)