sklearn中Pipeline包的用法
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
"""
使用方法:
输入一连串数据挖掘步骤,最后一步必须是估计器,前几步是转换器
输入的数据集经过转换器的处理后,输出的结果作为下一步的输入
最后用于估计器进行分类
每一步都是元祖(‘名称’,步骤)来表示
流水线功能:
跟踪记录各步骤操作
对各步骤进行封装
确保代码的复杂程度不至于超出掌控范围
"""
pip = Pipeline([('sc', StandardScaler()),
('pca', PCA(n_components=2)),
('clf', LogisticRegression(random_state=666))
])
pip.fit(x_train, y_train)
print('Test accuracy is %.3f'% pip.score(x_test, y_test))