从码农以及星际爱好者视角看AlphaStar完胜人类职业玩家

本文回顾了AlphaStar击败职业星际争霸2玩家的里程碑事件。AlphaStar利用特殊的训练方法,如AlphaStar League,学习了大量人类玩家的数据,并在与TLO和MaNa的比赛中展现出强大的微操作和策略。尽管人类玩家在有限的条件下挽回一些颜面,但AlphaStar展示了AI在复杂策略游戏中的潜力。
摘要由CSDN通过智能技术生成

640?wx_fmt=gif

640

今年一月份AlphaStar刚登场时写的文章,翻出来给大家扫盲什么是星际争霸,什么是人工智智能。

AlphaStar

北京时间2019年01.24凌晨2:00,DeepMind的伦敦总部,《星际争霸2》游戏人工智能AlphaStar首秀。DeepMind是全球人工智能领军,AlphaGo和AlphaZero的创造者,这里就不多介绍了。星际2作为一款当今世界最复杂的即时战略游戏,含经济运营,兵伐诡道,战争迷雾以及瞬息万变的策略,自2016年起,就被DP当做一个攻克目标。相比之下,围棋棋盘是固定的,双方是摊开了局面战斗;而星际2类似于真实战争,作战双方不知道对方的经济详细情况和所有战略战术—-一句话,战场无法预测,没有套路!

星际2解说 Artosis 与 Rotterda全程解说。首先问了暴雪的游戏总监Tim Morten:“为什么那么热切和DeepMind合作?”

答:“星际2是当今水平最高竞技游戏,也是人工智能研究的里程碑。”

“暴雪作为合作伙伴意味着什么?”

答:“我们团队非常困难地开发了一款特殊版本的星际2,作为工具公开发布,同时也和SP紧密合作。这个特殊版本和普通版不同,但是规则相同,适合SP研究。最大的不同就是,我们在游戏研究中必须大量预先设置比如live surfing,所以我们今天将观看的都是比赛回放录播,你知道,实时比赛必须从选手视角直播。”

Artosis接着问了DP的研究合作领导Oriol Vinyals:“为什么选择星际作为AI研究目标?”

答:“DP的研究任务就是人工智能,所以找一个检验标准很重要,在开展任务之前,用来检验算法和Agent。这是我们研究的第一个电脑游戏,就像围棋那样 。但星际和其它游戏相比它最突出的挑战就是,很明显下一步对我们的AI Agent来说,挑战的等级很高,我在这个图里高光标注了。”

640?wx_fmt=png

首先是“信息类型”不完美,意思是Agent不知道也无法预测人类选手现在在做什么。不像围棋,如果

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值