笔记：pipeline浅尝

最新推荐文章于 2023-02-13 22:26:10 发布

notabitwise

最新推荐文章于 2023-02-13 22:26:10 发布

阅读量115

点赞数

分类专栏：萌新

本文链接：https://blog.csdn.net/alittlenewer/article/details/119734943

版权

本文介绍了如何使用scikit-learn的Pipeline来整合预处理步骤和模型训练过程，以提高代码的整洁性和效率。首先，详细说明了预处理步骤，包括数值型和类别型变量的处理；接着，定义了一个随机森林回归模型；最后，通过Pipeline将预处理和模型结合起来，并展示了如何利用交叉验证来评估模型性能。

摘要由CSDN通过智能技术生成

简介：pipeline可以使代码更清洁，简化ml的步骤

前序步骤—代码预处理

由于非重点，这里简略

pipeline的导入

导入：from sklearn.pipeline import Pipeline

步骤1：预处理步骤定义

————导入
from sklearn.compose import CloumnTransformer
from sklearn.preprocessing import OneHotEncoder
from sklearn.impute import SimpleImputer
————分类不同变量
numerical_transformer=SimpleImputer()
categorical_transformer=Pipeline(steps=[
(‘imputer’,SimpleImputer(strategy=‘most_frequent’)), #插补最常出现的
(‘encoder’,OneHotEncoder(handle_unknown=‘ignore’)) #这里不加sparse=False
])
————定义最终预处理器
preprocessor=ClomnTransformer(transformers=[
(‘num’,numerical_transformer),
(‘cat’,categorical_transformer)
])

步骤2：模型定义 #这里选用随机森林

————导入
from sklearn.ensemble import RandomForestRegressor
—

最低0.47元/天解锁文章

notabitwise

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
笔记：pipeline浅尝

简介：pipeline可以使代码更清洁，简化ml的步骤前序步骤—代码预处理由于非重点，这里简略pipeline的导入导入：from sklearn.pipeline import Pipeline步骤1：预处理步骤定义————导入from sklearn.compose import CloumnTransformerfrom sklearn.preprocessing import OneHotEncoderfrom sklearn.impute import SimpleImputer
复制链接

扫一扫

专栏目录