集成学习（上）——评估模型的性能并调参_集成学习怎么调参呀-CSDN博客

本文链接：https://blog.csdn.net/suandyanr/article/details/115310497

本文介绍了集成学习中的模型评估与调参方法。首先，通过sklearn的Pipeline简化工作流，将机器学习流程串联起来。接着，详细讲解了k折交叉验证，包括KFold、StratifiedKFold和cross_val_score的区别与应用。然后，探讨了模型参数调优，利用学习和验证曲线进行模型诊断，并采用网格搜索进行超参数调优。最后，提到了ROC曲线在评估模型性能中的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Datawhale 集成学习（上）——评估模型的性能并调参

前言

对前面的调参章节进行补充（前面落下的现在需要补上）

一、使用pipline简化工作流

通过sklearn中的sklearn.pipline.Pipeline()可以引入管道机制，也就是将机器学习中的工作流程串起来，在工作流程中可以将前一个节点处理得到的结果直接转送到下一个节点进行处理。
需要注意的是：管道流中的节点都需要实现fit()和tranform()，最后一个节点实现fit()方法

# 需要注意的是make_pipline和Pipeline 的使用区别
# 首先需要引入的是基础使用的类型;
from sklearn.svm import SVR     # 引入SVR类
from sklearn.preprocessing import StandardScaler # 由于SVR基于距离计算，引入对数据进行标准化的类
from sklearn.model_selection import GridSearchCV  # 引入网格搜索调优
from sklearn.model_selection import cross_val_score # 引入K折交叉验证
from sklearn import datasets

# 在这里引入两种不同管道用法
from sklearn.pipeline import make_pipeline   # 引入管道简化学习流程
from sklearn.pipeline import Pipeline

# 首先引入数据：
boston = datasets.load_boston()
X = boston.data()
y = boston.target()
features = boston.feature_names
# 现对数据进行标准化；然后对数据将数据输入到SVR中，可以使用pipline管道机制：
pipSVR = make_pipline(StandardScaler(), SVR()