文章目录
b站视频链接:https://www.bilibili.com/video/BV1SW411S7xv?spm_id_from=333.880.my_history.page.click
Why AutoML?
- 企业找不到人工智能的专家,成本过高
- 机器学习模型研发的不确定性
- 60%人工智能项目以失败告终
什么是AutoML?
Progressive Automation of Machine Learning
机器学习框架
//不包括深度学习的传统机器学习
数据清洗
-
缺失值:补全或产生其他信号
-
数据类型:对人来说很容易,自动化较难
-
异常值:算法角度考虑,特殊处理或剔除
-
文本编码:多语言处理,难以检测,根据统计信息做预测
-
数据分割:
特征提取
- 数值衍生特征
- 离散特征
- 文本特征
- 时序特征
- 交叉特征
特征选择、降维
- 线性投影
- 非线性投影
- 特征筛选
模型选择、训练
- 模型选择
- 参数选择
- 模型训练
超参需要在训练前选择好,系统如何选择超参值得深思
目前的自动化围绕特征工程和超参的选择进行。
AutoML技术平台
AutoML其他功能
深度学习框架
数据清洗
- 缺失值
- 数据类型
- 异常值
- 文本编码
- 数据分割
特征编码
- 数值特征变换
- 序列编码
- 图像编码
模型设计、训练
神经网络模型非常复杂,所以设计困难,网格搜索、随机搜索和贝叶斯搜索效果都不好,而是用neural architecture search
AutoDL技术平台
挑战
- 算法严重依赖先验知识,不能推广到不同的问题(数据)
- 对于不同的网络拓扑结构,需要定制算法
- 计算量大(~1万GPU小时)
- 冷启动
OneClickai-增强元学习
优点
- 统一的算法优化机器学习和深度学习
- 特征工程和模型同步优化
- 训练速度快
- 从数据中积累行业知识
OneClickai界面