AutoGluon(官网:https://auto.gluon.ai/stable/index.html)
AutoGluon:可用于文本、图像和表格数据的 AutoML。 AutoGluon 支持易于使用和易于扩展的 AutoML,重点是自动堆栈集成、深度学习以及跨越文本、图像和表格数据的实际应用程序。
AutoGluon 面向机器学习初学者和专家,使您能够:
- 使用几行代码快速为原始数据构建深度学习和经典 ML 解决方案原型。
- 在没有专业知识的情况下自动利用最先进的技术(在适当的情况下)。
- 利用自动超参数调整、模型选择/集成、架构搜索和数据处理。
- 轻松改进/调整您的定制模型和数据管道,或为您的用例自定义 AutoGluon。
1.示例
使用AutoGluon在表格、图片、文本数据集上训练和发展一个高性能模型
from autogluon.tabular import TabularPredictor
predictor = TabularPredictor(label=COLUMN_NAME).fit(train_data=TRAIN_DATA.csv)
predictions = predictor.predict(TEST_DATA.csv)
2.安装
AutoGluon目前支持python3.6, 3.7或3.8。 目前支持Linux和Mac操作系统,Windows版正在推出。
(操作详细见Installation FAQ.)
这里以Linux系统下的GPU版本为例安装:
!pip install -U pip
!pip install -U setuptools wheel
# Here we assume CUDA 10.1 is installed. You should change the number
# according to your own CUDA version (e.g. mxnet_cu100 for CUDA 10.0).
!pip install -U "mxnet_cu101<2.0.0"
!pip install autogluon
AutoGluon 被模块化为专门用于表格、文本或图像数据的子模块。您可以通过单独安装特定子模块来减少所需的依赖项数量:python3 -m pip install <submodule>
,其中 <submodule>
可能是以下选项之一:
- autogluon.tabular - 仅用于表格数据 (TabularPredictor)
- autogluon.tabular独立的默认安装是一个骨架安装。
- 通过
pip install autogluon.tabular[all]
安装与通过pip install autogluon
安装相同 - 可用的可选依赖项:lightgbm、catboost、xgboost、fastai。这些都包括在内。
- 实验性可选依赖项:skex。这将使 KNN 模型在 CPU 上的训练和推理速度提高 25 倍。使用
pip install autogluon.tabular[all,skex]
启用,或在标准安装 AutoGluon 后pip install “scikit-learn-intelex<2021.3”
- autogluon.vision - 仅用于计算机视觉(ImagePredictor、ObjectDetector)
- autogluon.text - 仅用于自然语言处理 (TextPredictor)
- autogluon.core - 仅对任意代码/模型的超参数调整有用的核心功能(Searcher/Scheduler)。
- autogluon.features - 仅用于特征生成/特征预处理管道的功能(主要与表格数据相关)。
- autogluon.extra - 各种额外功能,例如Efficient Neural Architecture Search
- autogluon.mxnet - MXNet 的杂项额外功能。