2017年,AI在人类设计的所有游戏中都打败了人类 | 行业

转载 2017年12月28日 00:00:00
640?wx_fmt=png&wxfrom=5&wx_lazy=1

大型年度AI人物评选——2017中国AI英雄风云榜榜单评选出了年度技术创新人物TOP 10;商业创新人物TOP 10,获取完整榜单请关注网易智能公众号(ID:smartman163),回复关键词“评奖”。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


【网易智能讯 12月28日消息】在20世纪的大部分时间里,国际象棋是人工智能研究人员的一个基准。早在上世纪50年代初,约翰?麦卡锡提出了“人工智能”一词,他曾把国际象棋称为“人工智能领域的果蝇”,这一说法来源于早期对果蝇的研究对遗传学领域的影响。


上世纪90年代末,IBM的“深蓝”与世界冠军加里?卡斯帕罗夫进行了一系列国际象棋比赛。


在1997年,深蓝最终击败了卡斯帕罗夫,这是机器第一次在比赛中击败世界冠军。到本世纪早中期,这项技术已经进步到了一定程度,在几乎所有不同玩法的游戏中,机器都在不断地打败国际象棋大师。


自然而然地,人工智能开发者开始转向其他更复杂的游戏,以测试他们日益复杂的算法。在过去的12个月里,人工智能跨越了一系列的新门槛,最终在各种不同的游戏中击败了人类玩家,从古老的围棋游戏到动态互动的纸牌游戏,德州扑克。


从国际象棋到围棋


上世纪90年代末,机器终于彻底打败了国际象棋大师后,一位来自普林斯顿的天体物理学家评论说,“可能要等上一百年,电脑才能在围棋中打败人类——甚至可能更长。”


于是计算机科学家们又把研究的注意力转向围棋,这是一个来自中国的古老的策略游戏,非常容易学会,但是很难做到精通。

在过去的十年中,机器学习的发展创造了真正有竞争力的人工智能围棋选手。2014年,谷歌开始开发一个名为AlphaGo的深度学习神经网络。在经历了几年的接近成功之后,开发团队尝试了一些不同的东西。


在2016年末,一个名为“Master”的神秘网络围棋选手出现在了亚洲热门游戏服务器Tygem上。在接下来的几天里,这个神秘的玩家在于许多世界冠军的比赛中占据了主导位置。到2017年1月4日,官方确认“Master”实际上是DeepMind的AI AlphaGo的最新版本。


0?wx_fmt=jpeg


2017年5月,AlphaGo “Master”打败了柯洁——世界上排名第一的围棋选手。在AlphaGo和柯洁对战的三场比赛中,这台机器一直处于优势地位,但最令人吃惊的是,在10月份的时候,谷歌已经研究出了一个比“Master”更先进的AlphaGo版本。


根据《自然》杂志的一篇文章中,AlphaGo Zero是一种革命性的算法,它能够迅速地自学围棋。这个系统一遍又一遍地与自己对战,掌握了不同情况下的游戏方法。经过21天的学习,AlphaGo Zero已经达到了“Master”的水平。40天后,它就已经超过了之前所有版本的技能水平。


到2017年12月,DeepMind推出了一个更先进的系统版本。这款名为AlphaZero的新人工智能可以在几小时内掌握多种游戏。经过8个小时的自我训练,该系统不仅可以击败之前的AlphaGo Zero,还可以完全掌握国际象棋和日本将棋。


掌握扑克牌中的“欺诈”术


尽管围棋游戏的复杂度已经非常之高,但对于人工智能来说,围棋和扑克采用是两种完全不同的模式。要想在扑克游戏中取胜,你需要掌握一定的欺诈技能。欺诈以及识别他人的欺诈是在纸牌游戏中取胜需要掌握的关键技能。


经过十多年的尝试,在2017年,两项独立研究显示,人工智能终于打败了一流的扑克牌专业人士。来自加拿大阿尔伯塔大学的研究人员推出了一个人工智能系统,DeepStack,它可以用一种人工智能形式的“直觉”来全面控制人类扑克玩家。


0?wx_fmt=jpeg


After a grueling 20-day marathon, the machine has comprehensively thrashed all four professional poker players


卡内基梅隆大学的一个研究小组在2017年1月举办了一场更加公开的活动,当时它的Libratus AI系统花了20天时间,与四名专业的扑克玩家一起玩了12万局无限注“德州扑克”。尽管专业人士每天晚上都在讨论他们可以利用人工智能的哪些弱点,但这台机器每天都在改进自身,修补游戏玩法中的漏洞,改进策略。


人类的大脑无法与机器匹敌,在经过近一个月的不间断游戏之后,这台机器总共赢了170万美元,而这4位专业人士中的每一位都损失了数千美元的虚拟货币。其中一名专业玩家对《连线》杂志说:“在这次激烈的比赛中,我感觉自己在和一个作弊的人比赛,就好像我的牌可以被他看到一样。我不是在指责它作弊。这其实是一件好事。”


埃隆·马斯克的AI研究


2015年,埃隆?马斯克和一小群投资者成立了一个名为OpenAI的项目。该项目旨在探索人工智能系统的发展,尤其是在强化学习方面。在这种系统中,机器可以教会自己如何在特定的任务中提高自己的能力。


2017年8月,OpenAI团队将目光投向了征服Dota 2,这是一场名为“The International”的大型电子竞技锦标赛中的核心比赛。Dota 2是一款非常受欢迎且非诚复杂的多人在线对战游戏,在竞技游戏领域是一项严肃的比赛。


0?wx_fmt=jpeg


在仅仅两周的学习之后,OpenAI机器人就加入到了这场锦标赛中,随后击败了世界上的几名顶尖选手。目前人工智能系统只被训练过较为简单的一对一版本的游戏,但OpenAI团队正在研究如何让AI掌握五对五的“团队”游戏。


AI通过分工玩转“吃豆人”游戏


几年前,谷歌DeepMind对其人工智能在49款雅达利2600的游戏中进行了训练。只要有和人类玩家相同的输入,AI就会知道如何玩这些游戏并在游戏中获胜。事实证明,有些游戏确实比其他游戏更难以驾驭,在这些经典的、众所周知非常困难的游戏中,20世纪80年代的一款电子游戏“吃豆人”尤其具有挑战性。


2017年,谷歌收购了一家名为Maluuba的深度学习创业公司,并将其并入DeepMind。Maluuba的新型机器学习方法被称为“混合式奖赏架构”(HRA)。将这种方法应用到吃豆人系统中,该系统创建了150多个个体代理,每一个都有特定的目标——比如找到一个特定的豆子,或者避免幽灵。


0?wx_fmt=jpeg


HRA方法生成一个高级代理,类似于高级经理。在做出每一步的最终决定之前,这个高级代理会评估所有来自下级代理的建议。这种方法被委婉地称为“分而治之”,即把复杂的任务分解成更小的部分。


在将这个方法应用到吃豆人之后,AI很快就掌握了如何获得999990分的高分,这是之前没有人或人工智能能做到的。


AI将开始设计游戏


如果人工智能能在几乎每一场比赛中击败我们,那我们下一步该干什么?


法尔茅斯大学的一名研究人员最近公布了一种机器学习算法,他声称这一算法可以为我们创造出自己的游戏,我们从零开始玩游戏。这个人工智能系统名为Angelina,它每天都在不断改进自己,但目前它已经可以利用从维基百科共享到在线报纸以及社交媒体等各种来源的数据集制作游戏。


那么这一切意味着什么呢?


也许2017年最重大、最可怕的发展是强化学习系统的巨大进步。这些程序可以有效地教会它们自己如何掌握新技能。例如,最近的AlphaZero迭代可以在几天的自主学习之后,在一些游戏中获得超能力。


一项对350多名人工智能研究人员进行的大规模调查显示,人工智能还不足以打败我们。这项调查预测,在10年内,人工智能将会比我们更优秀,到2049年它将能够写出一部畅销小说,到2053年,它将会比人类在外科手术中表现的更好。事实上,该调查得出的结论是,到2060年,人工智能将有50%的几率能够完成我们所能做的所有事情,并且效果会更好。


2017年无疑是人工智能在日益复杂的游戏中打败人类的里程碑式的一年,尽管这看起来是一项微不足道的成就,但它的影响是巨大的。许多这些人工智能开发公司正迅速将目光投向现实世界的挑战。


谷歌DeepMind已经将AlphaGo Zero的系统应用到了其他领域,并进行了一项有关蛋白质折叠的全面研究,以期揭示治疗阿兹海默和帕金森等疾病的治疗方法。


“最终,我们希望利用像这样的算法突破来帮助解决各种现实世界问题中亟待解决的问题,”DeepMind的共同创始人兼首席执行官杰米斯·哈扎比斯(Demis Hassabis)说,“如果类似的技术可以应用于其他结构性问题,比如蛋白质折叠、减少能源消耗或寻找革命性新材料,那么取得的突破将有可能加强人类对这个世界的理解,并对我们所有人的生活产生积极影响。”

640?wx_fmt=png640?wx_fmt=jpeg

添加小助手 加入交流群

点击如下关键词查看往期内容

人物专访 沈向洋 | 于尔根 | 洪小文 | 李德毅 | 尤瓦尔 | 哈萨比斯 | 宋继强 | 杨强 | 余凯 | 邓志东 | 芮勇 | 戴文渊 | 石博盟 | 韦东 | 黄学东


行业特稿 抢滩智能音箱(上) | 抢滩智能音箱(下) | 自动驾驶行业素描(上) | 自动驾驶行业素描(下) | 机器翻译技术与应用


重磅报告 麦肯锡(二) | AlphaBeta & ABC | 埃森哲 |  英国政府 | Internet Society | Forrester | VertoAnalytics 麦肯锡(一) | 苹果公司 | 耶鲁大学 

640?wx_fmt=jpeg


人类的15个欲望与游戏设计

万事开头难,我们往往在游戏设计初期都会思考这样一个问题,我要做一个什么样的游戏?这个游戏能给玩家带来什么样的乐趣?似乎有不少人在这个时候会变得很困惑。希望此文能够对大家有所帮助~同时有不到之处还请指出...
  • wanlixingzhe
  • wanlixingzhe
  • 2014年06月07日 20:18
  • 654

《人类简史》读书笔记(分析阅读)

一、结构 1.1 分类 该书属于论述类理论型书 1.2 概括 一句话:作者以智人发展历史上的认知革命、农业革命和科技革命三大革命为主线,阐述了智人从动物到上帝的发展历程。 百字文: ...
  • Blateyang
  • Blateyang
  • 2017年12月23日 21:50
  • 78

《科学》封面重磅论文:人工智能终于能像人类一样学习

与DL深度学相媲美的BPL贝叶斯规划学习
  • ge_gewu
  • ge_gewu
  • 2016年03月28日 15:20
  • 799

人类简史读书笔记

有人推荐我读人类简史这本书,就把人类简史这本书下载到kindle上看,书中的内容和观点别具匠心,常常以一种不同的观点看待社会现象,下面纪录一些比较有意思的笔记。 1 人类是靠讲故事,塑造虚拟的故事...
  • hongchangfirst
  • hongchangfirst
  • 2016年04月18日 18:18
  • 1427

视觉感知特性 【1】人类视觉系统的信息处理机制的4个特性

这篇博客是视觉感知特性,这是因为在以后的研究中可能会与这个有很大的关系。我给自己找的一个方向就是根据人类视觉特性压缩视频,首先第一步就是了解什么是视觉感知特性,然后如何用数学方法描述视觉感知特性,最后...
  • linweieran
  • linweieran
  • 2015年11月29日 22:41
  • 4564

读《人类简史》有感

我是从窦文涛在其节目《圆桌派》中谈人工智能的时候,了解到了尤瓦尔.赫拉里这个人的。瞬间被他像神一般俯瞰众生的视角所吸引,于是买了电子版的《人类简史》详读。前前后后,零零碎碎大概用了1周的时间,读完了整...
  • chrisjingu
  • chrisjingu
  • 2017年08月07日 17:04
  • 241

AI技术与伦理

2017年是AI发展最快的一年,AI 威胁论一波未平,一波又起。这其中牵扯到AI滥用、AI透明性、算法公平、AI伦理、AI监管和责任、AI信任等问题,我们看到其中有一部分正在拟定相关的标准和规范。不过...
  • ben_tsai
  • ben_tsai
  • 2017年11月29日 21:38
  • 53

人工智能取代人类-----人类进化

李克强提出“互联网+”后,貌似我们国家的IT领域也进入了快速发展的阶段 ,不仅仅各大培训机构在宣传这个政策,连普通的卖猪用户也要跟上潮流,建一个网站。当然了,技术是一直发展,能让码农快乐,更能赚钱啊,...
  • huanongying131
  • huanongying131
  • 2016年04月25日 13:52
  • 3649

遗传基因科普(4):为何人类不能制造DNA分子?

遗传基因科普(4):为何人类不能制造DNA分子?在遗传基因科普(3)中,我们知道遗传基因DNA分子又细又长,而且能够断裂(发生碎片化现象),在碎片的运送中,有可以连接复原。这一切都是容易想象的,没有丝...
  • yuanmeng001
  • yuanmeng001
  • 2015年10月22日 03:28
  • 632

人工智能真的会取代人类劳动吗?

专家们提出警告,机器代替人类劳动或将使人类成为多余。他们担心我们发现了这一强大力量却还不明白如何正确运用。有人担忧人工智能进步可消灭数以百万计就业的人士,对人类造成“终结者”式的威胁。不过这些担忧其实...
  • dashenghuahua
  • dashenghuahua
  • 2016年11月15日 10:44
  • 804
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:2017年,AI在人类设计的所有游戏中都打败了人类 | 行业
举报原因:
原因补充:

(最多只允许输入30个字)