模型自动化生成
定义内涵
模型自动化生成是对指定的经过数据预处理后的数据文件,按照预设的一定参数,自动
训练出一系列机器学习模型。通过多个模型的对比,保存效果和性能较为优秀的模型,或者
按照一定的集成学习策略,如 Stacking、Bagging 等,将多个简单模型进行集成,形成效果
更优的模型。
技术背景
目前有很多开源的 AutoML 项目已经实现了模型的自动化生成,如 H2O、Autogluon 等。
作为一个用于分布式
、可扩展机器学习的内存平台,H2O 能够与 Hadoop 和 Spark 等大数据技术无缝协作。H2O 提供了许多流行算法的实现,例如广义线性模型 (GLM)、梯度提升机
(包括 XGBoost)、随机森林、深度神经网络、堆叠集成、朴素贝叶斯、广义加性模型 (GAM)、
Cox 比例风险、K- Means、PCA、Word2Vec,以及全自动机器学习算法。通过输入一系列超
参数即可完成模型的训练,对零代码基础的用户非常友好。
033
SecXOps 关键技术
Autogluon 是亚马逊推出的一个新的开源库,开发人员可以使用该库构建包含图像、文本
或表格数据集的机器学习应用程序。使用 Autogluon,只需编写