基于pipeline的模型训练和可视化——机器学习训练营

本文介绍了如何使用Pipeline构建数据流水线进行机器学习模型训练,详细阐述了Pipeline的工作原理和参数设置,特别是针对数据中的空值处理。通过KNNImputer节点填充空值,然后进行KNN分类。实验结果显示,k值的选择对模型测试准确率有显著影响,[3, 5]之间的k值是较好的选择,避免过拟合和欠拟合问题。" 124291620,9245416,ThinkPHP:计算距离并聚合查询排序,"['PHP', 'MySQL']
摘要由CSDN通过智能技术生成

基于pipeline模型训练&可视化

什么是Pipeline, 我这里直接翻译成数据管道。任何有序的操作有可以看做pipeline,例如工厂流水线,对于机器学习模型来说,这就是数据流水线。
是指数据通过管道中的每一个节点,结果除了之后,继续流向下游。对于我们这个例子,数据是有空值,我们会有一个KNNImputer节点用来填充空值,
之后继续流向下一个kNN分类节点,最后输出模型。

Parameters

steps : 步骤:列表(list)
被连接的(名称,变换)元组(实现拟合/变换)的列表,按照它们被连接的顺序,最后一个对象是估计器(estimator)。
memory:内存参数,Instance of sklearn.external.joblib.Memory or string, optional (default=None)
属性,name_steps:bunch object,具有属性访问权限的字典
只读属性以用户给定的名称访问任何步骤参数。键是步骤名称,值是步骤参数。或者也可以直接通过”.步骤名称”获取

results = list()
strategies = [str(i) for i in [1, 2, 3, 4
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值