笔记:pipeline浅尝

本文介绍了如何使用scikit-learn的Pipeline来整合预处理步骤和模型训练过程,以提高代码的整洁性和效率。首先,详细说明了预处理步骤,包括数值型和类别型变量的处理;接着,定义了一个随机森林回归模型;最后,通过Pipeline将预处理和模型结合起来,并展示了如何利用交叉验证来评估模型性能。
摘要由CSDN通过智能技术生成

简介:pipeline可以使代码更清洁,简化ml的步骤

前序步骤—代码预处理

由于非重点,这里简略

pipeline的导入

导入:from sklearn.pipeline import Pipeline

步骤1:预处理步骤定义

————导入
from sklearn.compose import CloumnTransformer
from sklearn.preprocessing import OneHotEncoder
from sklearn.impute import SimpleImputer
————分类不同变量
numerical_transformer=SimpleImputer()
categorical_transformer=Pipeline(steps=[
(‘imputer’,SimpleImputer(strategy=‘most_frequent’)), #插补最常出现的
(‘encoder’,OneHotEncoder(handle_unknown=‘ignore’)) #这里不加sparse=False
])
————定义最终预处理器
preprocessor=ClomnTransformer(transformers=[
(‘num’,numerical_transformer),
(‘cat’,categorical_transformer)
])

步骤2:模型定义 #这里选用随机森林

————导入
from sklearn.ensemble import RandomForestRegressor

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值