进化计算在深度学习中的应用 | 附多篇论文解读

基于遗传规划的自动机器学习

自动机器学习(Automated/Automatic Machine Learning, AutoML)作为近年来逐渐兴起的热门研究领域,旨在降低机器学习的门槛,使其更加易用。

一般而言,一个完整的机器学习(特别是监督式机器学习)工作流通常包含以下部分,数据清洗,特征工程,模型选择,训练测试以及超参数调优。每一道工序都有相当多的实现选项,且工序之间相互影响,共同决定最终的模型性能。

对于机器学习使用者而言,针对具体任务设计实现合适的工作流并不容易,在很多情况下可能会耗费大量的时间进行迭代。AutoML 的目标便是尽可能地使以上的过程自动化,从而降低使用者的负担

本次我们要同大家分享的是近年来在 AutoML 领域内比较有影响力的一个工作,基于树表示的工作流优化(Tree-based Pipeline Optimization Tool, TPOT)

TPOT 的作者为 Randal S. Olson 等人,相关文献为 [1] (2016 EvoStar Best Paper) 和[2] (2016 GECCO Best Paper),我们在这里将两篇文献的内容统一为大家作介绍。

292b7c07ce33068266b7a6b5adc89546036f04f5

 图1:机器学习工作流中被TPOT优化的部分

如图 1 所示,TPOT 希望从整体上自动优化机器学习的工作流 。在 TPOT 中,一个工作流被定义为一棵树,树上每一个非叶子节点为操作(Operator)节点,叶子节点则为数据节点。数据集从叶子节点流入,经过操作节点进行变换,最终在根节点处进行分类/回归,图 2 给出了一个例子。

25cca20bf77da9d9b10a7ff8cc321a965f845165

 图2:基于树表示的工作流的一个例子

TPOT 一共定义了 4 种操作节点类型(见图 3),分别是预处理、分解/降维、特征选择以及学习模型。这些操作的底层实现均是基于 Python 的机器学习库 scikit-learn。

5d05b6316a81d685673c7b16277d79d14c38cb1a

 图3:TPOT操作节点类型

有了以上基于树的表示,TPOT 直接利用遗传规划(具体来说,是 Python 库 DEAP 中的 GP 实现)对工作流进行优化。在搜索过程中,任一工作流首先在训练集上训练,然后在独立的验证集上评估(另一种更为耗时的选项是交叉验证)。在搜索结束后,TPOT 将返回最好的工作流所对应的代码。

转载于:https://my.oschina.net/u/3611008/blog/1821851

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Contents xi 1 Introduction 1 1.1 Genetic Programming in a Nutshell . . . . . . . . . . . . . . . 2 1.2 Getting Started . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 Prerequisites . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.4 Overview of this Field Guide . . . . . . . . . . . . . . . . . . 4 I Basics 7 2 Representation, Initialisation and Operators in Tree-based GP 9 3 Getting Ready to Run Genetic Programming 19 4 Example Genetic Programming Run 29 5 Alternative Initialisations and Operators in Tree-based GP 39 6 Modular, Grammatical and Developmental Tree-based GP 47 7 Linear and Graph Genetic Programming 61 8 Probabilistic Genetic Programming 69 9 Multi-objective Genetic Programming 75 10 Fast and Distributed Genetic Programming 83 11 GP Theory and its Applications 97 III Practical Genetic Programming 109 12 Applications 111 13 Troubleshooting GP 131 14 Conclusions 141 IV Tricks of the Trade 143 A Resources 145 A.1 Key Books . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 A.2 Key Journals . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 A.3 Key International Meetings . . . . . . . . . . . . . . . . . . . 147 A.4 GP Implementations . . . . . . . . . . . . . . . . . . . . . . . 147 A.5 On-Line Resources . . . . . . . . . . . . . . . . . . . . . . . . 148 B TinyGP 151 B.1 Overview of TinyGP . . . . . . . . . . . . . . . . . . . . . . . 151 B.2 Input Data Files for TinyGP . . . . . . . . . . . . . . . . . . 153 B.3 Source Code . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 B.4 Compiling and Running TinyGP . . . . . . . . . . . . . . . . 162 Bibliography 167 Index 225 xiv
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值