《Automated Evolutionary Approach for the Design of Composite Machine LearningPipelines》笔记

目标: 设计机器学习管道(自动化生成具有复杂结构的数据驱动模型)

原因: 构造复合管道是一项复杂耗时的任务,现有的机器学习实现缺乏自动化,需要人为选择特                征选择方式,构建模型。

优化公式:                             f^{max}(P^{*}) = \max_{P\in \mathbb{P}} f(P|T_{gen} \leqslant \tau_{g} )

f是适应函数,在限制时间内最大的适应值,\mathbb{P}为所有可能的管道结构,P^{*}为最优结构。

六大问题:

                1、在实际问题中复合结构不清楚是否优于简单结构

                2、仍然没有统一的方式来表示不同模型和操作

                3、目前没有方法结合ML和WMS(工作流管理系统)

                4、如果设计需要对每个结构块的影响进行分析

                5、需要统一的超参数调整,可以有效地来对不同的建模任务和类型数据

                6、需要简单易行的导出和导入复合管道的专门方法

设计部分分为组成和超参数调整两个部分。

组成部分:优化前加载数据库,搜索空间,目标,终止标准,进化搜索算法的超参数。建议使用之前AutoML解决方案作为初始,减少收敛的时间。整个进化的过程中,算法测量新生成管道的目标,利用训练样本获得新的复合模型的结构和参数,之后用一个测试集来评估指标。见图1

超参数调整部分:通过实验回归和分类得到的结果比较,选择使用同步调优算法,见图2

 图1

 

图2 

 本文提出的整体框架:

 图3

 参考文献:

[1]Nikitin N O, Vychuzhanin P, Sarafanov M, et al. Automated evolutionary approach for the design of composite machine learning pipelines[J]. Future Generation Computer Systems, 2021.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值