数据处理之一——Pipeline


1 Pipeline概述

Pipeline可用于将多个估计器连接为一个估计器。
在处理数据和训练估计器时通常有固定的步骤,例如特征选择、规范化、参数搜索和分类,而Pipeline就可以避免重复计算,同时对Pipeline里的所有估计器做相同的操作。
Pipeline中除最后一个估计器外的所有估计器都必须是转换器(即必须有转换方法)。最后一个估计器可以是任何类型(转换器、分类器等)。

还可以对多个学习器进行整合,合并特征空间并ensemble模型。

2 使用

from sklearn.pipeline import make_pipeline
make_pipeline(*steps, **kwargs)
例如:

>>> from sklearn.naive_bayes import GaussianNB
>>> from sklearn.preprocessing import StandardScaler
>>> make_pipeline(StandardScaler(), GaussianNB(priors=None))
Pipeline(steps=[('standardscaler', StandardScaler()),
                ('gaussiannb', GaussianNB())])

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值