作者|LAKSHAY ARORA 编译|VK 来源|Analytics Vidhya
概述
PyCaret是一个超级有用的Python库,用于在短时间内执行多个机器学习任务
学习如何依赖PyCaret在几行代码中构建复杂的机器学习模型
介绍
我建立的第一个机器学习模型是一个相当麻烦的代码块。我仍然记得构建一个集成模型,它需要许多行代码,它十分需要一个向导来解开这些混乱的代码!
当涉及到构建可解释的机器学习模型时,尤其是在行业中,编写高效的代码是成功的关键。所以我强烈建议使用PyCaret库。
我希望PyCaret在我的刚学习机器学习的日子里出现!这是一个非常灵活和有用的库,我在最近几个月已经相当依赖。我坚信任何有志成为数据科学或分析专业人士的人都会从使用PyCaret中受益匪浅。
我们将看到PyCaret到底是什么,包括如何在你的机器上安装它,然后我们将深入研究如何使用PyCaret来构建可解释的机器学习模型,包括集成模型。
目录
什么是PyCaret?为什么要使用它?
安装PyCaret
熟悉PyCaret
使用PyCaret训练我们的机器学习模型
使用PyCaret构建集成模型
分析模型
做出预测
保存并加载模型
什么是PyCaret?为什么要使用它?
PyCaret是Python中一个开源的机器学习库,它可以帮助你从数据准备到模型部署。它很容易使用,你可以用一行代码完成几乎所有的数据科学项目任务。
我发现PyCaret非常方便。以下是两个主要原因:
PyCaret是一个代码库,它使你的工作效率更高。你可以在代码上花更少的时间,做更多的实验
它是一个易于使用的机器学习库,将帮助你执行端到端的机器学习实验,无论是输入缺失值、编码分类数据、特征工程、超参数调整,还是构建集成模型
安装PyCaret
这是最直接的。可以直接使用pip安装PyCaret的第一个稳定版本v1.0.0。只需在Jupyter Notebook中运行以下命令即可开始:
!pip3 install pycaret
熟悉PyCaret
问题陈述和数据集
在本文中,我们将解决一个分类问题。我们有一个银行数据集,包括客户年龄、经验、收入、教育程度,以及他/她是否有信用卡。该行希望建立一个机器学习模型,帮助他们识别购买个人贷款可能性更高的潜在客户。
数据集有5000行,我们保留了4000行用于训练模型,剩下的1000行用于测试模型。你可以在这里找到本文中使用的完整代码和数据集。