Alpha GO核心原理

以下文章摘录自:

《机器学习观止——核心原理与实践》

京东: https://item.jd.com/13166960.html

当当:http://product.dangdang.com/29218274.html

(由于博客系统问题,部分公式、图片和格式有可能存在显示问题,请参阅原书了解详情)

 

1.1    Alpha GO简述

Alpha GO诞生于后来被Google收购的DeepMind公司,是历史上第一个打败人类围棋世界冠军的AI程序。在此之前,人们普遍认为类似围棋这类凝聚了“人类智慧结晶”的领域对于人工智能来讲是不可突破的,因而Alpha GO的出现可以说是意义非凡。

当然,Alpha GO从诞生到最终打败围棋世界冠军也并非是“一蹴而就”的。它幕后的核心作者主要有如下几位:

l  Demis Hassabis

Demis既是DeepMind公司的创始人,同时也被人们称为“Alpha GO之父”。他在13岁时曾经获得过国际象棋大师的称号,而围棋则是其在大学时才开始研究的。Demis较早的时候就发现了人工智能一些瓶颈,于是选择神经科学做为博士攻读方向,以期从针对“人类”的研究中获得突破

l  David Silver

David博士毕业于加拿大ALBERTA大学,是DeepMind公司的资深研究员。而且Alpha GO发表于Nature上的论文《Mastering the game of GO with deep neural networks and tree search》中,David是第一作者,可见其在Alpha GO的发展过程中起到了非常关键的作用

l  Aja Huang

Aja Huang的中文名为“黄士杰”,他是一位台湾人。根据公开资料显示,Aja接触围棋的时间较早,其博士论文《New Heuristics for Monte Carlo Tree Search Applied to the Game of GO》也是研究的这一领域。2012年Aja加入DeepMind并担任高级研究员,彼时Alpha GO项目事实上只有他唯一一个开发工程师(David是项目经理,而Demis是公司老板)。所以后来我们看到Nature上发表的论文中,Aja和David并列第一作者;Alpha GO的几次与人类的世纪大战,也皆是他作为“人肉臂”来完成的比赛,因而他在Alpha GO的发展过程中的重要作用可见一斑

 

图 ‑ 发表于Nature上的《Mastering the Game of Go with Deep Neural Networks and

Tree

  • 5
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值