AlphaStar的游戏——星际争霸2 AI综述

        两天前,DeepMind直播展示了他们星际2AI的最新进展。AI名叫Alphastar,它在与两位职业选手的比赛录像中获得了全胜,其中一位还是世界前10的顶尖神族选手Mana。在与Mana最后一场万众瞩目的现场直播比赛中,Mana捍卫了星际2职业选手的尊严,取得胜利扳回一局。

        面对这些,让人禁不住脱口而出的还是那句话:“没想到这么快”。星际2远比围棋复杂,DeepMind、facebook、阿里和腾讯等众多公司与科研单位也因而把研究星际2作为迈向通用人工智能的一把钥匙。我一直有关注星际2的比赛,很清楚以serral为首的目前顶尖职业选手变态到了何种地步。DeepMind上一篇相关论文还在研究受限环境下的小游戏,让我觉得挑战职业选手还得等好几年,真没预料到这一天来的如此突然。

        本文将按以下结构进行展开:游戏要素,常用战术,职业选手,比赛进程,此前研究,问题解决,工程,算法,泛化预期。只关心技术的读者可以直接跳到后面几节。

游戏要素

        《星际争霸2》是一款RTS(即时战略)游戏,说白了就是造农民采矿、造建筑、造兵、攀科技,最后派兵拆光对手的建筑。与围棋相比,虽然都属于零和博弈,但还多了不完全信息、输入输出状态空间更庞大、存在海量先验信息、游戏预测困难的问题。星际2的基本要素可分为:

  • 经济:有晶体和气矿两种资源,资源有限会采完,通过造更多的农民、在矿物旁开更多的分基地来提高采集率。
  • 生产力:有资源了就可以造建筑,建筑可用于生产部队、提高最大人口(上限200)、提升科技和构筑防御。
  • 部队:有资源和产兵建筑了就可以生产作战单位,单位分为空中和陆地,有的还能释放技能;单位存在相互克制,但可以依靠微操(精细控制)来消除甚至逆转克制关系。
  • 科技:提升科技可以解锁更高级的单位,以及提升各类单位的能力;随着部队规模越来越大,研发科技的收益也会越来越高。
  • 侦查:地图上没有己方单位的地方不可见,也无法得知对手的建筑正在生产研发些什么;所以要通过单位侦查、占领瞭望塔和使用侦查技能来了解对手的现状。
  • 地图:星际2有诸多比赛地图,根据地图的大小、出生点距离、路口形状等,也存在着不同的种族和战术优势,所以一局比赛的打法势必要根据地图来调整的。

常用战术

        星际2在10年来的发展中已经进化出了海量的战术,可以把它们大致划分为这几类:

  • 快攻:牺牲经济和科技的发展,尽可能在初期就全力建造部队击败对手;为了加快速度,经常需要把产兵建筑偷偷造在对手的基地附近,还可以派出部分甚至所有农民来协助进攻。
  • Timing一波:预测对手的兵力薄弱期,通过固定的运营策略,在这些时间点集结出尽可能强大的兵力发动总攻,并且往往伴随着关键科技的恰巧升级完成。
  • 压制:派出部队前压,占对手的一些便宜或者把对手压在家里无法开矿,而自己则趁机扩张。
  • 骚扰:派出高机动单位、空中单位或者运输局运载部队,尽量避开敌方主力而去击杀对方的农民,从而打击他的经济。
  • 控图:处于均势时,在战线上四处游走,进行充分的侦查,了解敌方主力位置和构成,等待时机进攻或者骚扰。
  • 偷经济:认为敌方不会细致侦查时,偷
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值