简介:pipeline可以使代码更清洁,简化ml的步骤
前序步骤—代码预处理
由于非重点,这里简略
pipeline的导入
导入:from sklearn.pipeline import Pipeline
步骤1:预处理步骤定义
————导入
from sklearn.compose import CloumnTransformer
from sklearn.preprocessing import OneHotEncoder
from sklearn.impute import SimpleImputer
————分类不同变量
numerical_transformer=SimpleImputer()
categorical_transformer=Pipeline(steps=[
(‘imputer’,SimpleImputer(strategy=‘most_frequent’)), #插补最常出现的
(‘encoder’,OneHotEncoder(handle_unknown=‘ignore’)) #这里不加sparse=False
])
————定义最终预处理器
preprocessor=ClomnTransformer(transformers=[
(‘num’,numerical_transformer),
(‘cat’,categorical_transformer)
])
步骤2:模型定义 #这里选用随机森林
————导入
from sklearn.ensemble import RandomForestRegressor
—