python 机器学习sklearn中Pipeline用法

最新推荐文章于 2024-07-03 18:25:49 发布

小白逆袭记

最新推荐文章于 2024-07-03 18:25:49 发布

阅读量875

点赞数 1

文章标签：数据挖掘 python

本文链接：https://blog.csdn.net/Big_Older/article/details/105850953

版权

sklearn中Pipeline包的用法

from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
"""
使用方法:
输入一连串数据挖掘步骤,最后一步必须是估计器,前几步是转换器
输入的数据集经过转换器的处理后,输出的结果作为下一步的输入
最后用于估计器进行分类
每一步都是元祖(‘名称’，步骤)来表示
流水线功能:
跟踪记录各步骤操作
对各步骤进行封装
确保代码的复杂程度不至于超出掌控范围
"""
pip = Pipeline([('sc', StandardScaler()),
                ('pca', PCA(n_components=2)),
                ('clf', LogisticRegression(random_state=666))
                ])
pip.fit(x_train, y_train)
print('Test accuracy is %.3f'% pip.score(x_test, y_test))