sklearn之自定义转换器和流水线Pipeline

自定义转换器

自定义一个类。添加TransformrMixin作为基类,则可以直接得到fit_transform()方法;添加BaseEstimator作为基类,则可以获得两个调整超参数的方法:get_params()和set_params()。
实例:将X(pandas.DataFram)格式转换为numpy.array

from sklearn.base import BaseEstimator, TransformerMixin

class Selector(BaseEstimator, TransformerMixin):
    def __init__(self, attribution_name):
        self.attribution_name = attribution_name

    def fit(self, X, y=None):
        return self

    def transform(self, X, y):
        return X[self.attribution_name].values

流水线

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler, MinMaxScaler

pipe = Pipeline([
    ("stand", StandardScaler()),
    ("min_max", MinMaxScaler())
])

data = pipe.fit_transform(data)

还有一个FeatureUnion,为它提供一个转换器列表(可以使整个转换器流水线),当transform()方法被调用时,它可以并行运行每个转换器的transform()方法,等待他们的输出,然后将他们连接起来返回结果
如:

from sklearn.pipeline import FeatureUnion

pipe_1 = ...
pipe_2 = ...
full_pipe = FeatureUnion(transform_list=[
		("pipe_1", pipe_1), 
		("pipe_2", pipe_2)
	])
	
data = full_pipe.fit_transform(data)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值