零基础机器学习--自动化库Pycaret快速入门指南之回归任务

Pycaret

PyCaret是一个代码量超低的机器学习库,它有效的自动化了机器学习工作流。实现了端到端的机器学习和模型管理工具,可以成倍地加快机器学习的学习、部署和实践速度。本文主要介绍Pycaret的特色、优势和理念,喜欢的朋友请关注本专栏,后续将带来Pycaret基础使用和进阶使用的超详细教程,这篇教程主要关注这个库的一些最简单的使用方式。

回归任务

PyCaret的回归模块是一个有监督的机器学习模块,用于估计因变量(通常称为 "结果变量",或 "目标")和一个或多个自变量(通常称为 "特征","预测因素",或 "协变量")之间的关系。回归的目的是预测连续值,如预测销售金额、预测数量、预测温度等。它提供了几个预处理功能,通过设置功能为建模准备数据。这个模块包含了超过25个随时可用的算法和多个图来分析训练模型的性能。

这个函数初始化训练环境并创建转换管道。设置函数必须在执行任何其他函数之前调用。它需要两个强制性参数:数据和目标。所有其他的参数都是可选的。

from pycaret.datasets import get_data
data = get_data('insurance')

from pycaret.regression import *
s = setup(data, target = 'charges')

当设置被执行时,PyCaret的推理算法将根据某些属性自动推断出所有特征的数据类型。数据类型应该被正确推断出来,但情况并非总是如此。为了处理这个问题,PyCaret会显示一个提示,要求确认数据类型,一旦你执行设置。如果所有的数据类型都是正确的,你可以按回车键,或者键入退出退出设置。

另外,你也可以在设置中使用 numeric_features 和 categorical_features 参数来预先定义数据类型。

比较模型

这个函数使用交叉验证法对模型库中所有可用的估计器的性能进行训练和评估。这个函数的输出是一个带有交叉验证平均分数的评分网格。可以使用get_metrics函数访问CV期间评估的指标。可以使用add_metric和remove_metric函数添加或删除自定义指标。

best = compare_models()

print(best)

分析模型

这个函数分析训练过的模型在测试集上的表现。在某些情况下,它可能需要重新训练模型。

evaluate_model(best)

evaluate_model 只能在笔记本中使用,因为它使用了 ipywidget 。你也可以使用 plot_model 函数来单独生成图。

plot_model(best, plot = 'residuals')

plot_model(best, plot = 'feature')

预测

该函数使用训练好的模型预测Label。当数据为零时,它在测试集(在设置函数中创建)上预测标签和分数。

predict_model(best)

评估指标是在测试集上计算的。第二个输出是pd.DataFrame,包括对测试集的预测(见最后两列)。要在未见过的(新)数据集上生成标签,只需在predict_model函数中传递数据集。

predictions = predict_model(best, data=data)
predictions.head()

保存模型

save_model(best, 'my_best_pipeline')

重载模型

loaded_model = load_model('my_best_pipeline')
print(loaded_model)

更多精彩内容:

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
零基础python机器学习快速入门机器学习是一门涉及数据分析、统计学和计算机科学的学科,使用算法和模型来让计算机自主学习,从而能够对未知数据进行预测和决策。Python是一种广泛应用于机器学习领域的编程语言,由于其易读易写的特性,成为了机器学习初学者的首选。 要快速入门Python机器学习,以下是一些建议: 1. 学习Python编程基础:学习基本语法、控制流、函数、面向对象编程等基础知识,以便能够编写Python程序。 2. 学习Python的科学计算:掌握NumPy、Pandas和Matplotlib等,它们提供丰富的数学计算、数据分析和数据可视化功能。 3. 学习机器学习:掌握Scikit-learn,它是Python中最流行的机器学习之一,提供了大量的机器学习算法和工具。 4. 学习机器学习基础概念:了解机器学习的基本概念和常用算法,如监督学习、无监督学习、回归、分类、聚类等。 5. 完成实践项目:通过完成一些简单的机器学习项目,如房价预测、垃圾邮件分类等,将理论知识应用到实际问题中。 6. 参考教程和文档:利用网络上丰富的教程和文档资源,学习更多关于Python机器学习的知识和技巧。 7. 加入社区和论坛:参与机器学习社区和论坛,与其他学习者交流和分享经验,可以加速学习的过程。 通过以上步骤,你将能够快速掌握零基础Python机器学习入门所需的知识和技能,并能够开始构建自己的机器学习项目。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wormhacker

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值