Datawhale 集成学习(上)——评估模型的性能并调参
前言
对前面的调参章节进行补充(前面落下的现在需要补上)
一、使用pipline简化工作流
通过sklearn中的sklearn.pipline.Pipeline()可以引入管道机制,也就是将机器学习中的工作流程串起来,在工作流程中可以将前一个节点处理得到的结果直接转送到下一个节点进行处理。
需要注意的是:管道流中的节点都需要实现fit()和tranform(),最后一个节点实现fit()方法
# 需要注意的是make_pipline和Pipeline 的使用区别
# 首先需要引入的是基础使用的类型;
from sklearn.svm import SVR # 引入SVR类
from sklearn.preprocessing import StandardScaler # 由于SVR基于距离计算,引入对数据进行标准化的类
from sklearn.model_selection import GridSearchCV # 引入网格搜索调优
from sklearn.model_selection import cross_val_score # 引入K折交叉验证
from sklearn import datasets
# 在这里引入两种不同管道用法
from sklearn.pipeline import make_pipeline # 引入管道简化学习流程
from sklearn.pipeline import Pipeline
# 首先引入数据:
boston = datasets.load_boston()
X = boston.data()
y = boston.target()
features = boston.feature_names
# 现对数据进行标准化;然后对数据将数据输入到SVR中,可以使用pipline管道机制:
pipSVR = make_pipline(StandardScaler(), SVR()