Master没学过人类棋谱？这才是它比老AlphaGo更恐怖之处

weixin_34310127

于 2017-01-05 17:02:51 发布

阅读量166

点赞数

文章标签：人工智能

原文链接：https://yq.aliyun.com/articles/68379

版权

在Master完成60胜，结束人机车轮战后，因与AlphaGo对战而成名的欧洲围棋冠军樊麾就在社交网络上发表了一篇公告。

在这篇公告中，谷歌公司明确表示Master是“阿法狗”的升级测试版，而在其中更是有个惊人的所在——Master可能完全没学过棋谱，而这也侧面印证了Master不按常理出牌的套路。

人类与人工智能共同探索围棋？

樊麾目前是谷歌DeepMind团队测试工程师，在公告中，樊麾代表DeepMind团队写道：

“我们最近很努力地开发阿尔法围棋，刚过去的几天我们在网络的对弈平台进行了一些非正式的快棋对局，目的是为了检验我们最新版本的阿尔法围棋是否如我们的预期。”

“我们需要感谢所有与我们的Magister(P) 和Master(P) 账户在弈城围棋网以及野狐围棋网对弈的棋手，也要感谢所有观战的人！最新的阿尔法围棋在对局中所富有启发性的创新，我们从中可以学到的，以及对局的结果都令我们非常激动。”

谷歌团队声明：

0bf7ec51636411681af19435c43fa7e10f70da35

在这段公告中还有耐人寻味的一段：

“世界冠军古力与阿尔法围棋对弈以后写了，‘人类与人工智能共同探索围棋世界的大幕即将拉开’。我们现在结束了非正式的测试，非常期望今年能有机会与围棋组织以及专家共同探索神秘的围棋，在相互启发的气氛中共同领会围棋的奥妙。我们希望尽快发布其他公告。”

人类与人工智能共同探索围棋世界的大幕即将拉开？是的，谷歌看上去是要将围棋AI领域探索作为一个重要突破口。

要知道，DeepMind公司创始人哈萨比斯此前在一次采访中曾透露，他们的团队正在尝试训练一个没有学习过人类棋谱的人工智能，这也可能就是Master和AlphaGo不同的原因。

如果Master真的没有学习过人类棋谱，而有了突飞猛进的实力，那恰恰印证了谷歌AI技术的全新突破。

《自然》杂志封面：

0c80798cd7db6aed98069a3d051e0f4c0770ce5f

它的棋力哪里是极限？

AlphaGo的棋力已经不言而喻，但更可怕的是它的学习能力。

在2015年10月，AlphaGo在与欧洲冠军樊麾的对弈中就在公平的情况下以5比0完胜。樊麾在接受媒体采访时认为，AlphaGo的可怕在于“从不犯错”。

但在樊麾与AlphaGo的五盘大战棋谱被放上网络后，就有不少围棋业余高手在网络上发表评论，其中不少人认为樊麾这次的棋下得并不出色。

但当时《自然》杂志就写道，“人类在下棋时有一个劣势，在长时间比赛后，他们会犯错，但机器不会。而且人类或许一年能玩1000局，但机器一天就能玩100万局。”

“围棋AI的学习能力非常强大，就像当初‘深蓝’第一次输给了卡斯帕罗夫，但不到一年第二次对弈就赢了比赛。”

据《自然》杂志介绍，AlphaGo的核心是两种不同的深度神经网络：“策略网络”（policy network）和 “值网络”（value network）。它们的任务在于合作“挑选”出那些比较有前途的棋步，抛弃明显的差棋。

更恐怖的是它的“进化”深度学习能力，用了2000万局的对子对弈进行训练，每一次都能提升棋力。

Via 今日头条

weixin_34310127

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。