叮~AutoML自动化机器学习入门指南,来了

本文介绍了AutoML的基本概念,强调了它在降低机器学习开发门槛中的作用。主要内容包括AutoML的关键节点,如自动化特征工程和模型选择,并探讨了多种超参数优化方法。此外,还介绍了市面的AutoML产品,如开源框架auto-sklearn和商业服务Google Cloud、Microsoft Azure。文章详细阐述了auto-sklearn的使用,包括AutoSklearnClassifier和AutoSklearnRegressor,并提及了深度学习领域的AutoDL框架auto-keras,支持图片分类和文本分类等任务。
摘要由CSDN通过智能技术生成

之前的工作中也有多少接触过这个AutoML(Automated Machine Learning)的概念,简单来说就是把模型开发的标准过程模块化,都交给一些自动化的组件来完成,比如数据集的划分、特征衍生、算法选择、模型训练、调优、部署以及后续的监控,都“一条龙”地在AutoML实现。

从Google Cloud绘制的AutoML的工作原理图可以看出,我们使用者只需要给其提供数据源,以及好坏样本(或者不需要),然后后面的一切都交给AutoML组件去完成。

???? AutoML的关键节点

我们可以认识到AutoML大大降低了机器学习模型的开发门槛,但是我们还是需要了解这里面的原理的,这里涉及了机器学习的几个关键节点的内容,需要我们特别关注。

其中最为重要的是自动化特征工程了,一般缩写为“Auto FE”,主要是包括了预处理、特征选择、特征提取、元学习等等的操作,把每一个环节的处理逻辑写到脚本里,结合一些策略让逻辑更加科学,结果更加合理。

第二个就是自动化模型选择,也叫Automated Model Selection,简称AMS,就是根据实际的数据来选择合适的算法。因为大多数的算法都是有超参数的,这时候AutoML是需要进行自动化的超参数优化的,英文叫做Hyperparameter Optimization,简称HPO,在学习中了解到这块的知识研究还是蛮丰富的,主要有下面的一些方法:

  • 基于贝叶斯优化的超参数优化 Bayesian Optimization

  • 基于进化算法的超参数优化 Evolutionary Algorithms

  • 基于本地搜索的超参数优化 Local Search

  • 基于随机搜索的超参数优化 Random Search

  • 基于粒子群优化算法的超参数优化 Particle Swarm Optimization

  • 基于元学习的超参数优化 Meta Learning

  • 基于迁移学习的超参数优化 Transfer Learning

还有一个概念就是NAS,即Neural Architecture Search(神经网络结构搜索),因为目前深度学习应用很广泛了,很多时候是需要搭建一个深度神经网络,这里面涉及的参数是真的多,按照传统的超参数优化的方法显得十分吃力,所以也有了这个NAS的概念,而关于NAS的研究方法,主要有下面几种:

  • 基于进化算法的超参数优化 Evolutionary Algorithms

  • 基于元学习的超参数优化 Meta Learning

  • 基于迁移学习的超参数优化 Transfer Learning

  • 基于本地搜索的超参数优化 Local Search

  • 基于强化学习的超参数优化 Reinforcement Learning

  • 基于Network Morphism

  • 基于 Continuous Optimization优化

 

???? 市面上的AutoML产品

目前AutoML工具我们可以从两个途径来进行获取学习:

  • 开源框架:如Auto-Keras、Auto-sklearn等开源工具

  • 商业服务:如Google Cloud、Microsoft Azure等

从Awesome-AutoML-Papers(https://github.com/hibayesian/awesome-automl-papers#projects)里有一张AutoML工具的对比图,大家可以浏览一波。

名称 支持类型 编程语言
AdaNet NAS Python
Advisor HPO Python
AMLA HPO, NAS Python
ATM HPO Python
Auger HPO Python
Auto-Keras NAS Python
AutoML Vision NAS Python
AutoML Video Intelligence
Python
AutoML Natural Language NAS Python
AutoML Translation NAS Python
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值