终极算法——第五章:进化学派:自然的学习算法

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。

罗纳德·费雪在他的经典著作《自然选择的遗传理论》中提出了关于进化的第一套数学理论。虽然这个理论很妙,但是霍兰德认为它遗漏了进化论的精华。

费雪孤立地看待每个基因,但是有机体的适应度就是它所有函数的复值函数。如果基因都是独立的,它们变量的相对频率会快速收敛至最大适应点,然后从此保持平衡。但如果基因相互作用,进化(追求最大适应度)就要复杂得多。

冯·诺依曼证明了自我再生机器的可能性。

遗传算法的关键输入就是一个适应度函数。

遗传算法有点像选择育种。

遗传算法能够频繁作弊的方法,就是允许有永不灭亡的东西。

霍兰德称类似这样(垃圾邮件分类)的规则集为“分类器系统”,是他建立的机器学习部落中的一匹“驮马”:演化新论。

分类系统和多层感知器相比,其应用范围要窄得多。

1972年,尼尔斯·埃尔德雷奇和史蒂芬·杰伊·古尔德提出进化过程由一系列“间断平衡”组成,长期的停滞和短暂的快速变化互相交替,就像寒武纪爆发那样。

当前的峰值越高,该过程(某次幸运变异或交叉)发生前的那段时间就越长。

我们应主义遗传算法和多层感知器的差异程度。反向传播会在任何给定时间坚持单一假设,而且这个假设会渐渐改变,直到适应某个局部最优值。遗传算法会在每一步中考虑整个群体的假设,而由于交叉行为,这些假设可以从这一代跨到下一代。

机器学习中最重要的问题之一(也是关于生命最重要的问题之一),就是探索——利用困境。

霍兰德没有哪个理论结果表明,交叉行为能起作用。

消除性别对于演化新论者来说,就只剩下变异作为其理论的推动力。

性可以保持群体的多样性。

性优化的不是适应度,而是他们所谓的“混合度”:当与其他基因结合时,一个基因表现出平均水平良好的能力。

演化新论者和联结学派重要的共同点是:他们都因为受到自然启发而设计了学习算法,不过后来分道扬镳了。演化新论者关注的是学习架构,对他们来说,通过参数优化来对演化的架构进行微调,这是此重要的事情。相反,联结学派更喜欢用一个简单、手工编写的结构,加上许多连接行为,然后让权值学习来完成所有工作。

终极算法既不是遗传编程,也不是反向传播,但它得包含这两者的重要部分:结构学习和权值学习。

如今在自然和人工进化中,都存在一个很重要的微妙之处。我们会为每个备选的结构而不仅仅是最终的那个,而一直学习权值,目的是为了明白这些结构在生存竞争(在自然情况下)以及训练数据(在人工条件下)中的表现如何。在每一步中,我们想选择的结构,是在掌握权值之后(而不是之前),表现最好的那个。因此,实际上,先天 自然并不一定会排在后天培育之前,它们是相互交替的,每轮中的“培育”学习会为下一轮的“自然”学习做好基础,反之亦然。

进化寻求好的结构,而神经学习则填满这些结构:这样的结合是我们走向终极算法最简单的一步。

最重要的是,机器学习的目标是尽可能找到最好的学习算法,利用一切可能的方法,而进化和大脑不可能提供学习算法。

与联结学派及演化新论者相反,富豪学派和贝叶斯学派不相信“法自然”的说法。

贯穿心科学和理学的很多领域:是描述性理论与规范性理论之间的分歧。是“这就是它的样子”与“这就是它应该成为的样子”之间的分歧。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值