Pycaret
基本流程一般包含:读取数据->建模/对比模型->模型预测->绘图分析->模型导出
安装pycaret见此篇博文——>安装pycaret遇到的问题
使用此命令:——pip --default-timeout=100 install pycaret -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
另附官方源码——>https://github.com/pycaret/pycaret
官方阅读——>https://pycaret.org/guide/
从PyCaret的存储库加载数据
#从pycaret中加载数据
from pycaret.datasets import get_data
data = get_data('juice')
pycaret的资料存储库
核心代码方法:
anomaly.py 异常值检测(无监督)
arules.py 关联规则(无监督)
classification.py 分类(有监督)
clustering.py 聚类(无监督)
datasets.py 数据加载(辅助工具)
nlp.py 自然语言处理(无监督)
preprocess.py 预处理(辅助工具,被其它模块内部调用)
regression.py 回归(有监督)
导入模块
# Classification
from pycaret.classification import *
# Regression
from pycaret.regression import *
# Clustering
from pycaret.clustering import *
# Anomaly Detection
from pycaret.anomaly import *
# Natural Language Processing
from pycaret.nlp import *
# Association Rule Mining
from pycaret.arules import *
各个类实例
分类例
# Importing dataset
from pycaret.datasets import get_data
diabetes = get_data(